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Prólogo 


Uno  de  los  problemas  más  antiguos  de  las  matemáticas,  y  por  extensión  de  las  ciencias  y 
las  ingenierías,  es  la  resolución  de  ecuaciones  no  lineales;  y,  en  particular,  la  aproximación  de 
las  soluciones  de  las  ecuaciones  con  suficiente  exactitud.  Así,  nos  podemos  encontrar  con  una 
gran  cantidad  de  problemas  qne  se  pueden  reescribir  en  términos  de  ecuaciones  a  resolver, 
lo  qne  conduce  a  una  gran  variedad  de  ecuaciones:  sistemas  finitos  e  infinitos,  ecuaciones 
diferenciales  ordinarias  y  en  derivadas  parciales  sujetas  a  condiciones  iniciales  o  de  contorno, 
o  una  combinación  de  ambas,  y  ecuaciones  integrales  o  integrodiferenciables.  Además,  gene¬ 
ralmente,  estas  ecuaciones  son  no  lineales.  Las  variables  de  las  ecuaciones  pueden  ser  números 
reales  o  complejos  (ecuaciones  algebraicas  simples  con  una  sola  variable),  vectores  (sistemas 
de  ecuaciones)  o  funciones  (ecuaciones  diferenciales  o  integrales). 

Sin  embargo,  desde  el  punto  de  vista  del  análisis  funcional,  todas  estas  ecuaciones  se  pue¬ 
den  expresar  en  función  de  operadores  que  aplican  algún  espacio  lineal  en  otro  espacio  lineal, 
de  manera  que  las  soluciones  buscadas  son  elementos  o  puntos  del  espacio  correspondien¬ 
te.  En  consecuencia,  los  esquemas  numéricos  que,  en  este  marco  tan  general,  aproximan  las 
soluciones  de  esta  gran  variedad  de  problemas  conducen  al  desarrollo  de  métodos  efectivos 
y  fiables  que  aproximan  soluciones,  con  suficiente  exactitud,  de  las  ecuaciones  en  el  espacio 
original  o  en  un  espacio  relacionado.  Excepto  en  casos  especiales,  los  esquemas  numéricos  de 
resolución  más  comúnmente  utilizados  son  métodos  iterativos  que  proporcionan  una  sucesión 
que  converge,  a  partir  de  una  o  varias  aproximaciones  iniciales,  a  una  solución  de  la  ecuación 
a  resolver.  Como  estos  métodos  tienen  la  misma  estructura  recursiva,  los  hemos  introducido 
y  estudiado  dentro  de  un  marco  general:  el  de  los  espacios  de  Banach. 

Durante  los  últimos  años,  los  estudios  de  los  métodos  iterativos  incluyen  un  esfuerzo 
sustancial  en  la  identificación  de  propiedades  que  garanticen  su  convergencia  en  algún  sentido. 
Una  gran  cantidad  de  estos  resultados  consisten  en  aplicar  recursivamente  métodos  iterativos 
punto  a  punto  o  con  memoria.  En  este  texto,  analizamos  algunos  de  estos  métodos. 

Este  texto  es  fruto  de  la  tarea  docente  de  sus  autores,  a  lo  largo  de  los  últimos  años, 
en  cursos  de  doctorado  enfocados  a  la  resolución  de  ecuaciones  no  lineales  para  titulados 
en  Matemáticas  e  Ingeniería.  Su  contenido  va  dirigido  a  estudiantes  titulados  en  carreras 
científicas  y  técnicas  que  deseen  conocer,  de  manera  asequible,  sencillos  métodos  iterativos 
que  les  permitan  afrontar,  con  sencillez  y  rigor,  cuestiones  relacionadas  con  la  resolución  de 
ecuaciones  no  lineales.  Hemos  procurado,  en  todo  momento,  huir  de  un  texto  reducido  a 
una  colección  de  métodos  iterativos.  Hemos  insistido  en  desarrollar  técnicas  de  demostración 
asociadas  a  la  materia  aquí  presentada,  así  como  en  el  planteamiento  de  los  problemas,  en  los 
conceptos  fundamentales  que  intervienen,  en  las  estrategias  de  resolución  y  en  las  cuestiones 
relacionadas  con  la  convergencia.  Se  ha  buscado  un  equilibrio  entre  la  claridad  del  desarrollo 
y  la  profundidad  de  los  conceptos.  Y  uno  de  nuestros  objetivos  ha  sido  un  acercamiento  de  las 
matemáticas  puras  y  aplicadas,  que,  a  menudo,  son  vistas  por  los  estudiantes  sin  conexión. 
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El  principal  objetivo  de  este  texto  es  presentar  una  visión  general  de  algunos  resultados 
teóricos  básicos  sobre  ecuaciones  no  lineales  en  espacios  de  Banach,  así  como  analizar  algunos 
de  los  métodos  iterativos  que  resuelven  numéricamente  estas  ecuaciones.  También  esperamos 
proporcionar  un  texto  para  cursos  superiores  del  análisis  numérico  relacionado  con  estos 
tópicos  y,  para  facilitarlo,  hemos  tratado  de  hacer  un  texto  tan  autosuficiente  como  nos  ha 
sido  posible.  Para  ello,  hemos  escrito  un  primer  capítulo  introductorio  y  probado  gran  parte 
de  los  resultados  con  todo  detalle. 

Mientras  que  las  clases  se  pueden  desarrollar  en  un  contexto  más  o  menos  riguroso,  he¬ 
mos  escrito  este  texto  utilizando  métodos  y  hábitos  de  argumentación  pedagógicos.  Los  pre- 
rrequisitos  del  texto  son  el  cálculo,  el  álgebra  lineal  y  nociones  menores  de  programación 
computacional.  También  cierta  familiaridad  con  las  técnicas  básicas  para  resolver  ecuaciones 
simples  de  una  variable,  así  como  de  sistemas  de  ecuaciones  lineales,  resulta  beneficioso.  Si 
que  es  cierto  que  los  estudiantes  con  conocimientos  de  los  principios  del  análisis  numérico 
tienen  cierta  ventaja,  ya  que  los  esquemas  y  conceptos  generales  se  siguen  fácilmente  si  ya  se 
conocen  métodos  y  casos  particulares.  Sin  embargo,  dicho  conocimiento  no  es  prerrequisito 
indispensable  para  entender  el  material  aquí  tratado.  Ocurre  lo  mismo  con  los  conocimientos 
del  análisis  funcional  y  de  los  espacios  de  Banach  en  particular.  Todo  el  material  necesario  y 
requerido  para  la  teoría  desarrollada  a  lo  largo  del  texto  está  recogido  en  el  capítulo  1. 

Dos  son  principalmente  las  cuestiones  que  más  nos  han  preocupado  y  a  las  que  hemos  tra¬ 
tado  de  dar  respuesta.  Por  una  parte,  el  análisis  de  la  convergencia  de  métodos  iterativos,  con 
memoria  y  punto  a  punto,  que  utilizan  diferencias  divididas  cuando  se  aplican  a  la  resolución 
de  ecuaciones  no  lineales.  Para  ello,  presentamos  tres  técnicas  diferentes  de  demostración:  el 
principio  de  la  mayorante  de  Kantorovich,  una  técnica  basada  en  relaciones  de  recurrencia 
y  una  modificación  novedosa  de  la  técnica  anterior.  Por  otra  parte,  la  obtención  de  aproxi¬ 
maciones  iniciales  suficientemente  buenas  para  que  los  métodos  iterativos  aquí  considerados 
converjan  empezando  en  ellas. 

Hemos  dividido  el  texto  en  tres  partes  con  cinco  capítulos  y  el  texto  trata  de  ser  auto- 
suficiente.  Cada  capítulo  contiene  varios  resultados  que  se  han  ilustrado  con  aplicaciones  a 
la  resolución  de  sistemas  de  ecuaciones  no  lineales  que  surgen  de  procesos  de  discretización 
de  ecuaciones  diferenciales  e  integrales  no  lineales  que  aparecen  con  cierta  frecuencia  en  las 
ciencias  y  las  ingenierías. 

La  primera  parte  del  texto  consta  de  un  solo  capítulo,  el  capítulo  1,  donde  presentamos  una 
introducción  básica  del  marco  general  en  el  que  se  desarrollan  los  principales  contenidos  que 
aparecen  en  el  texto.  Para  ello,  hacemos  una  descripción  escueta  de  lo  que  son  los  espacios 
de  Banach  y  de  las  características  de  los  operadores  que  se  van  a  tratar.  También  damos 
una  descripción  muy  general  de  los  esquemas  iterativos  en  la  que  se  estudia  su  convergencia, 
haciendo  especial  hincapié  en  el  método  de  Newton,  que  es  el  origen  de  los  métodos  iterativos 
que  posteriormente  se  describen  y  estudian.  La  aplicación  del  método  de  Newton  pasa  por 
la  evaluación  de  la  derivada  primera  del  operador  implicado  en  cada  paso  de  iteración.  Bien 
porque  esta  derivada  no  exista  o  sea  costosa  de  evaluar,  los  métodos  iterativos  que  no  utilizan 
derivadas  son  especialmente  interesantes.  Un  procedimiento  para  construir  métodos  iterativos 
que  no  utilicen  derivadas  consiste  en  aproximar  éstas  mediante  diferencias  divididas.  De  este 
tipo  de  métodos  nos  ocupamos  ya  en  el  resto  del  texto. 

La  segunda  parte  del  texto  centra  su  atención  en  una  familia  de  métodos  iterativos  tipo 
secante  que  surge  a  partir  de  las  interpretaciones  geométricas  de  los  métodos  de  Newton  y  de 
la  secante,  y  que  son  métodos  iterativos  con  memoria.  Presentamos  un  resultado  de  conver- 


VII 


gencia  semilocal  ya  conocido,  basado  en  relaciones  de  recurrencia,  vemos  cuál  es  su  principal 
problema  y  lo  resolvemos  utilizando  dos  procedimientos:  la  construcción,  en  el  capítulo  2,  de 
un  método  iterativo  híbrido  (predictor-corrector)  y,  en  el  capítulo  3,  la  modificación  de  la 
técnica  de  demostración  de  la  convergencia  presentada  en  el  capítulo  2.  Destacamos  en  el  ca¬ 
pítulo  3  que  la  técnica  desarrollada  para  demostrar  la  convergencia  de  la  familia  de  métodos 
tipo  secante  tiene  la  ventaja,  con  respecto  a  la  presentada  en  el  capítulo  2,  de  que  permite 
tratar  ecuaciones  en  las  que  el  operador  implicado  puede  ser  diferenciablc  o  no  diferenciablc. 

La  tercera  parte  del  texto  está  dedicada  al  método  de  Steffensen,  que  es  un  método 
iterativo  punto  a  punto  que  tiene  la  misma  velocidad  de  convergencia  y  la  misma  eficiencia 
computacional  que  el  método  de  Newton.  Veremos  por  qué,  a  pesar  de  lo  anterior,  este 
método  es  mucho  menos  utilizado  que  el  método  de  Newton  y  qué  es  lo  que  podemos  hacer 
para  mejorar  su  utilización.  En  el  capítulo  4,  realizamos  un  análisis  desde  el  punto  de  vista 
de  la  teoría  de  Kantorovich  que  nos  permite  considerar  situaciones  en  las  que  el  operador 
implicado  es  diferenciable.  En  el  capítulo  5  lo  hacemos  desde  el  punto  de  vista  de  una  teoría 
basada  en  relaciones  de  recurrencia,  que  nos  permite  considerar  situaciones  en  las  que  el 
operador  implicado,  puede  se  tanto  diferenciable  como  no  diferenciable.  En  ambos  capítulos 
proponemos  la  utilización  de  un  método  iterativo  híbrido  (predictor-corrector). 

Al  final  del  texto  hemos  añadido  algunas  referencias  bibliográficas  que  nos  han  servido 
de  inspiración  a  lo  largo  de  los  últimos  años.  Por  supuesto,  ni  están  todas  las  que  son,  ni  son 
todas  las  que  están.  Pero  seguro  que  servirán  para  afianzar  el  interés  de  los  estudiantes  in¬ 
teresados  en  los  contenidos  del  texto,  de  manera  que  este  interés  les  conduzca  a  una  búsqueda 
bibliográfica  más  detalla  y  acorde  a  sus  futuras  inquietudes. 

No  queremos  terminar  sin  dar  las  gracias  a  todos  aquellos  que  nos  han  acompañado  a  lo 
largo  de  todo  este  tiempo.  En  particular,  a  los  que,  año  tras  año,  se  acercan  a  las  Jornadas 
de  Análisis  Numérico  y  Aplicaciones ,  y  ya  van  ocho,  que  celebramos  en  la  Universidad  de 
La  Rioja  durante  el  mes  de  noviembre.  Y,  en  particular,  a  nuestros  compañeros  del  grupo  de 
investigación  PRIENOL  (https://prienol.unirioja.es). 


Logroño,  La  Rioja 
Julio  de  201 4 


J.  A.  Ezquerro 
M.  A.  Hernández- Verón 
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PRELIMINARES 
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En  el  análisis  matemático  ordinario  trabajamos  con  el  sistema  de  los  números  reales  o 
complejos.  El  análisis  funcional  se  basa  en  la  utilización  de  espacios  lineales,  que  son  genera¬ 
lizaciones  de  estos  sistemas  de  números.  El  poder  del  análisis  funcional  reside  en  que  permite 
tratar  una  gran  variedad  de  problemas  que  surgen  del  hecho  de  que  los  espacios  lineales  están 
compuestos  de  interesantes  objetos  matemáticos  como  son  los  vectores  con  un  número  finito 
o  infinito  de  componentes  o  las  funciones  que  satisfacen  ciertas  condiciones  dadas.  Muchas 
transformaciones  y  ecuaciones  importantes  del  álgebra  y  del  análisis  matemático  ordinarios  se 
pueden  formular  en  términos  de  operadores  lineales  en  dichos  espacios.  El  análisis  funcional 
lineal,  que  es  la  teoría  de  los  espacios  lineales,  operadores  y  ecuaciones,  se  ha  desarrollado 
como  una  amplia  disciplina  matemática  con  multitud  de  aplicaciones. 

Entre  los  espacios  lineales,  los  espacios  normados  completos,  que  se  denominan  espacios 
de  Banach,  juegan  un  papel  importante.  Se  denominan  así  en  honor  de  Stefan  Banach  y 
son  uno  de  los  objetos  de  estudio  más  importantes  en  el  análisis  funcional.  Los  espacios  de 
Banach  son  típicamente  espacios  de  funciones  de  dimensión  infinita. 

Presentamos  una  introducción  básica  mínima  de  esta  teoría  en  esta  primera  parte  del 
texto  con  el  objetivo  de  que  éste  sea  autosuficiente. 

Por  otra  parte,  es  bien  conocido  que  encontrar  soluciones  de  ecuaciones  en  espacios  de 
Banach,  donde  el  operador  implicado  es  no  lineal,  es  un  problema  común  en  las  ciencias  y 
la  ingeniería.  Aunque  algunas  ecuaciones  se  pueden  resolver  analíticamente,  generalmente 
buscamos  aproximaciones  numéricas  de  las  soluciones,  ya  que  encontrar  soluciones  exactas 
habitualmente  es  difícil.  Utilizamos  normalmente  métodos  iterativos  para  aproximar  estas 
soluciones.  Así,  introducimos  algunas  ideas  básicas  acerca  de  los  métodos  iterativos  en  es¬ 
pacios  de  Banach  y,  en  particular,  del  método  de  Newton,  que  es  el  método  iterativo  más 
conocido  y  utilizado  para  resolver  ecuaciones  no  lineales  en  espacios  de  Banach.  Finalmente, 
presentamos  algunas  ecuaciones  no  lineales  que  aparecen  frecuentemente  en  la  literatura  ma¬ 
temática,  que  posteriormente  utilizamos  como  aplicaciones  para  ilustrar  los  resultados  que 
presentamos  en  las  partes  dos  y  tres  del  texto. 


Capítulo  1 

Conceptos  generales 


El  origen  de  la  teoría  de  los  espacios  de  Banach  se  encuentra  en  la  publicación  del  clásico 
Théorie  des  opérations  linéaires  |8j  por  parte  del  matemático  polaco  Stefan  Banach  (1892- 
1945)  en  1932.  Desde  su  nacimiento,  esta  teoría  estuvo  relacionada  con  el  resto  de  ramas  del 
análisis  matemático. 

Tras  unos  años  de  auge,  la  teoría  parecía  condenada  al  ostracismo.  Sin  embargo,  durante 
los  años  setenta  y  principios  de  los  ochenta,  la  teoría  tuvo  un  nuevo  periodo  de  gran  actividad, 
se  resolvieron  viejos  problemas  y,  lo  que  es  más  importante,  se  plantearon  otros  nuevos 
y  se  establecieron  nuevas  conexiones  con  otras  ramas  del  análisis  matemático,  tales  como 
análisis  armónico,  funciones  de  variable  compleja,  series  ortonormales,  teoría  de  aproximación 
o  probabilidad.  De  la  bibliografía  acerca  de  los  espacios  de  Banach  podemos  destacar  los 
textos  clásicos  de  Dunford-Schwarz  [19]  y  Day  [TB],  donde  se  recogen  los  principales  resultados 
de  la  época  comprendida  entre  los  años  treinta  y  cincuenta.  Resultados  más  recientes  pueden 
encontrarse  en  los  textos  de  Lindenstrauss-Tzafriri  Bu.  ra  y  Beauzamy  m- 

Como  dice  Wojtaszczyk  en  su  introducción  [48],  no  podemos  esperar  de  los  espacios  de 
Banach  que  nos  resuelvan  los  problemas  que  estemos  tratando,  pero  sí  que  nos  hagan  ver 
dichos  problemas  con  un  nuevo  enfoque  y  nos  permitan  aislar  sus  características  esenciales, 
obteniendo  así  una  gran  generalidad  en  los  resultados.  Además,  en  muchos  casos,  utilizar 
las  técnicas  y  los  teoremas  generales  de  los  espacios  de  Banach  puede  sugerirnos  nuevos 
problemas.  Al  trabajar  con  espacios  de  Banach,  abarcamos  una  gran  amplitud  de  situaciones, 
tales  como  ecuaciones  en  el  campo  real  o  complejo,  sistemas  de  ecuaciones  reales  o  complejas, 
ecuaciones  diferenciales  o  ecuaciones  integrales. 

A  continuación,  damos  una  introducción  de  los  conceptos  básicos  de  la  teoría  de  los 
espacios  de  Banach  que  son  esenciales  en  el  tratamiento  posterior  de  la  resolución,  mediante 
métodos  iterativos  que  utilizan  diferencias  divididas,  de  ecuaciones  con  operadores  no  lineales 
en  espacios  de  Banach.  Para  un  estudio  más  detallado  se  puede  consultar  cualquiera  de  los 
numerosos  tratados  que  hay  en  la  bibliografía  matemática,  entre  los  que  citamos  los  textos 
de  Berberian  m  Rudin  m  y  Curtain-Pritchard  na. 

Gran  cantidad  de  problemas  de  las  ciencias  y  la  ingeniería  se  pueden  expresar  como 
ecuaciones  con  operadores  no  lineales  en  espacios  de  Banach.  En  general,  para  resolver  es¬ 
tas  ecuaciones,  recurrimos  a  métodos  iterativos.  Entre  éstos,  destaca  especialmente,  por  su 
simplicidad  y  eficiencia,  el  método  de  Newton.  Este  método  proporciona  una  herramienta 
poderosa  para  la  investigación  teórica  y  numérica  de  las  ecuaciones  con  operadores  no  li¬ 
neales.  En  este  capítulo,  introducimos  la  teoría  del  método  de  Newton  desde  dos  puntos  de 
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vista:  el  principio  de  la  mayorante  de  Kantorovich  y  una  alternativa  basada  en  relaciones  de 
recurrencia,  desarrollada  por  los  autores  del  texto,  que  proporciona  buenos  resultados  y  es 
sencilla  de  aplicar. 

Terminamos  el  capítulo  presentando  algunos  tipos  importantes  de  ecuaciones  diferencia- 
bles  e  integrales  no  lineales  en  espacios  de  Banach.  A  continuación,  les  aplicamos  procesos  de 
discretización  para  transformarlas  en  sistemas  de  ecuaciones  no  lineales  que  posteriormente 
resolvemos  mediante  los  métodos  iterativos  presentados  en  este  texto. 


1.1.  Espacios  de  Banach 

Los  espacios  de  Banach  son  una  clase  importante  de  espacios  lineales  normados  que  reciben 
su  nombre  a  partir  de  las  contribuciones  fundamentales  del  matemático  polaco  Stefan  Banach 
al  análisis  funcional  lineal  |Sj. 

1.1.1.  Espacios  lineales  normados 

En  términos  abstractos,  un  espacio  vectorial  lineal  es  un  conjunto  de  elementos,  llamados 
habitualmente  puntos  o  vectores,  con  dos  operaciones,  la  adición  y  la  multiplicación  por  un 
escalar,  que  satisfacen  ciertas  condiciones.  En  particular,  se  requiere  que  la  adición  tenga  las 
mismas  propiedades  algebraicas  que  la  adición  de  los  números  reales  o  complejos. 

Cada  espacio  lineal  X  tiene  asociado  un  campo  escalar  K,  que  es  el  campo  de  los  números 
reales  M  o  el  de  los  complejos  C.  Llamamos  escalar  a  un  número  perteneciente  aKyse  dice 
que  X  es  un  espacio  lineal  real  o  complejo  según  sea  K  =  M.  o  K  =  C. 

La  estructura  algebraica  de  los  espacios  lineales  es  similar  a  la  del  sistema  de  los  números 
reales  o  complejos,  permitiendo  extender  muchas  técnicas  algebraicas  a  problemas  en  un 
marco  más  general.  Sin  embargo,  al  tratar  con  otros  conceptos  de  importancia  teórica  y 
computacional,  como  la  exactitud  de  aproximación  o  la  convergencia  de  sucesiones  o  series, 
es  necesario  introducir  una  estructura  adicional  en  estos  espacios.  La  estructura  métrica  (o 
topológica)  que  consideramos  aquí  se  basa  en  una  simple  generalización  de  la  idea  de  valor 
absoluto  de  un  número  real  o  módulo  de  un  número  complejo. 

Supongamos  que,  para  cada  elemento  x  de  un  espacio  lineal  X,  se  define  norma  de  x  como 
el  número  real  no  negativo  ||x||  que  satisface  las  siguientes  tres  condiciones: 

Ni:  ||x||  >  0  si  x  7^  0,  ||0||  =  0, 

N2:  ||Ax||  =  |A|||x||  para  todo  A  6  K, 

N3:  ||x  +  y ||  <  ||a;||  +  ||r/||,  para  todo  y  G  X. 

Entonces,  un  espacio  lineal  X  en  el  que  hay  definida  una  norma  se  llama  espacio  lineal 
normado. 

Es  fácil  ver  que  My  C  son  espacios  lineales  normados  con  ||x||  =  \x\.  Desde  un  punto  de 
vista  geométrico,  podemos  interpretar  ||x||  como  la  distancia  del  origen  0  del  espacio  al  punto 
x  o  como  la  longitud  del  vector  x. 

La  distancia  d(x,y )  de  un  punto  x  a  un  punto  y  se  define  en  un  espacio  lineal  normado 
X  como  d(x,  y)  =  ||a:  —  y ||.  Por  tanto,  si  consideramos  y  como  una  aproximación  a  x,  el  error 
de  la  aproximación  es  ||a:  —  y\\. 
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En  general,  en  un  espacio  lineal  se  pueden  introducir  diferentes  normas.  Por  ejemplo,  en 
y  Cn  se  definen 


\x\ 


=  NP  >  1  <p  <  oo, 


.  i=  1 


y 


x||oo  =  máx|xi|,  i  — 
(*) 


(i.i) 


(1.2) 


donde  x  —  (xi,x2,  ■  ■  ■  ,xn).  Obviamente  estas  definiciones  satisfacen  las  condiciones  Afi  y  N2. 
Para  verificar  N3  se  utiliza  la  desigualdad  de  Minkowski 


1  <  p  <  oo. 


.  2=1 


.  2=1 


.  2=1 


La  norma  infinito  es  el  caso  límite  cuando  p  — >  oo.  Para  verlo,  suponemos  que  H^Hoo  = 
|aq|  7^  0  y  escribimos 


\x\ 


=  kil  !  +  E 


i= 2 


X\ 


i 

p\  p 


Como 


Xi 

Xl 


<  1,  entonces 


lím  IblL  =  Ixil  =  llxl 


p— >-oo 


Los  espacios  Mn  y  Cn  con  la  norma  ||x||p  se  denotan,  respectivamente,  por  y  C”.  Designa¬ 
mos  con  M°°  (o  C°°)  al  conjunto  de  sucesiones  de  números  reales  (o  complejos).  En  M°°,  por 
ejemplo,  para  p  —  1  la  serie  infinita 


Nli  =  ¿ 


Xi 


2=1 


convergerá  en  un  subconjunto  de  M°°.  Este  subconjunto  es  un  subespacio  normado  de  M°° 
que  se  denota  por  í1. 

De  la  misma  forma,  para  1  <  p  <  oo,  podemos  definir  ip  como  el  subconjunto  de  M°°  (o 
C°°)  formado  por  los  vectores  x  tales  que 


\x\ 


=  E 


oo  \  I 

p 


Xi 


<  OO. 


.  i= 1 


Para  ver  que  estos  subconjuntos  son  espacios  normados,  debemos  considerar  la  desigualdad 
de  Minkowski  para  series  infinitas 


J2\xi  +  yi\P)  <  ,  l<p<oo, 


,  2=1 


>  2=1 


,  2=1 


y  comprobar  las  condiciones  de  subespacio. 

El  espacio  £°°  es  el  conjunto  de  todas  las  sucesiones  acotadas  reales  (o  complejas)  con  la 
norma  definida  en  (1.2): 
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Se  verifica  la  siguiente  relación  de  contenido  m- 

t  c  f  c  •  •  •  c  e°°. 

Es  natural,  para  espacios  de  funciones,  reemplazar  el  sumatorio  en  la  definición  de  norma 
por  una  integral.  Por  ejemplo,  el  subconjunto  L1([0, 1])  del  espacio  F([0, 1])  de  todas  las 
funciones  reales  x  =  x(t),  con  0  <  t  <  1,  para  las  cuales  la  integral  de  Riemann 

llalli  =  /  lx(^)l  dt 

Jo 

existe  y  es  finita,  es  un  espacio  normado,  como  lo  son  los  espacios  Lp([ 0, 1])  de  las  funciones 
reales  para  los  cuales  las  integrales 

\\x\\p  —  (J  \x(t)\p  dt^j  ,  1  <  p  <  oo, 

existen  y  son  finitas.  El  espacio  L°°([0, 1])  está  formado  por  todas  las  funciones  reales  acotadas 
con  la  norma 

ll^lloo  =  sup  \x(t)\. 
íe  [o,i] 

Los  conjuntos  Lp{\ 0, 1])  cumplen  la  siguiente  relación  [lUj 

L1([0,1])DL2([0,1])D...DL“([0,1]). 

Indicamos,  a  continuación,  cómo  relacionar  las  diferentes  normas  que  podemos  definir  en 
un  espacio  lineal.  El  concepto  que  las  relaciona  es  el  de  normas  equivalentes.  Así,  se  dice  que 
dos  normas  diferentes  ||x||  y  ||x||/  de  un  espacio  lineal  son  equivalentes  si  existen  constantes 
a,  b  tales  que  0  <  a  <  b  y 

a||x||  <  ||x|r  <  6||x||,  para  todo  x  G  X. 

Es  conocido  que  todas  las  normas  son  equivalentes  en  un  espacio  lineal  de  dimensión  finita 

m- 


1.1.2.  Operadores  lineales  y  acotados  en  espacios  de  Banach.  In¬ 
versión  de  operadores 

En  un  espacio  lineal  normado  X  podemos  definir  las  nociones  analíticas  de  convergencia 
y  límite  de  una  sucesión  de  elementos  del  espacio.  Denominamos  límite  de  una  sucesión  {xn} 
de  elementos  de  X  a  un  elemento  x*  tal  que 


lím  \\xn  —  £*11  =  0 

n— 


(1.3) 


es  decir:  si,  dado  e  >  0,  existe  N  e  N  tal  que  ||x*  —  xn\\  <  e  para  n  >  N .  Si  se  cumple  (1.3[), 
decimos  entonces  que  la  sucesión  {xn}  converge  a  x*  y  denotamos  límn^oc  xn  =  x*. 

Una  serie  infinita  X\  +  £2  +  ^3  +  •  •  •  de  elementos  de  un  espacio  lineal  normado  es  con¬ 
vergente  si  la  sucesión  {£n}  de  sumas  parciales 


n 

xn  =  J2xi 

Í=  1 
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converge.  En  este  caso,  denominamos  suma  de  la  serie  infinta  al  límite  x*  de  {xn}. 

Una  clase  importante  de  los  espacios  lineales  normados  son  los  llamados  espacios  de 
Banach.  El  asunto  a  tratar  en  la  resolución  de  muchos  problemas  es  la  existencia  de  un  límite 
x*  de  una  sucesión  {xn}  en  un  espacio  lineal  normado  X\  situación  común  en  el  análisis 
matemático  clásico  vinculada  a  la  idea  de  completitud. 

Para  introducir  la  propiedad  anterior  veamos  un  ejemplo  ilustrativo.  Consideramos  la 
sucesión  {qn}  de  números  racionales  definida  por 


9o 


n  —  0, 1, . . . 


(1.4) 


Es  conocido  que  no  existe  ningún  número  racional  q*  que  pueda  interpretarse  como  límite  de 
esta  sucesión.  Sin  embargo,  si  estudiamos  la  sucesión  anterior  en  el  ámbito  de  los  números 
reales,  vemos  que  tiene  límite  q*  y  que  además  es  solución  de  la  ecuación  x2  =  3,  [3Bj.  Al 
generalizar  esta  propiedad  que  poseen  los  números  reales  a  otros  espacios  aparece  la  idea  de 
completitud.  Es  interesante  destacar  que  la  completitud  no  se  deduce  de  las  propiedades  de 
los  espacios  normados,  sino  que  es  una  propiedad  adicional  que  un  espacio  puede  tener  o  no. 


Definición  1.1.  Una  sucesión  {xn}  de  elementos  de  un  espacio  lineal  normado  se  dice  de 
Cauchy  si 

lím  lím  \\xn+m  -  xn\\  =0. 

n— >-oo  ra— >-o o 

La  elección  de  una  norma  puede  ser  de  suma  importancia  cuando  tratamos  con  procesos 
infinitos  en  espacios  de  dimensión  infinita. 


Definición  1.2.  Se  dice  que  un  espacio  normado  X  es  completo  si  toda  sucesión  de  Cauchy 
es  convergente  a  un  límite  que  es  un  elemento  de  X . 


Así,  la  sucesión  de  números  racionales  definida  por  (1.4)  es  una  sucesión  de  Cauchy,  pero 
no  tiene  un  límite  racional.  En  consecuencia,  el  conjunto  Q  de  los  números  racionales  no  es 
completo.  Sin  embargo,  la  sucesión  anterior  vista  como  una  sucesión  de  números  reales  sí  que 
tiene  límite.  De  hecho,  el  conjunto  M  de  los  números  reales  es  completo. 


Definición  1.3.  Un  espacio  de  Banach  es  un  espacio  normado  completo. 


A  continuación,  damos  algunos  ejemplos  de  espacios  de  Banach. 


Ejemplo  1.4.  Los  espacios  Mn  y  Cn  con  las  normas 
(1.2)  son  espacios  de  Banach. 


i  pi 


l  <  p  <  oo,  definidas  en  (1.1)  y 


Demostración.  Si  un  espacio  normado  de  dimensión  finita  es  completo  para  una  norma, 
es  completo  para  cualquier  otra  norma  equivalente.  Por  consiguiente,  será  suficiente  probarlo 
para  la  norma  ||  •  || oo . 

Si  {xm  =  (xmi,Xm2,  ■  ■  ■  ,Xmn)}  es  una  sucesión  de  Cauchy  en  uno  de  estos  espacios,  en¬ 
tonces  las  sucesiones  {xmí},  i  —  1, ...  ,n,  son  de  Cauchy  en  1  o  C. 

Por  ser  estos  espacios  completos,  existen  los  números  x*,  i  —  1,  2, . . . ,  n,  tales  que 

lím  \xmi  —  |=0,  i  —  1,  2, . . . ,  n. 


Se  cumple  entonces 


{xmi\  — >■  x*,  1  <  i  <  n,  si  y  sólo  si  {xm}  — y  x*, 
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con  x*  =  (xl,xí,,  .  .  . ,  £*).  Por  tanto,  la  sucesión  {xm}  tiene  por  límite  x*.  Luego,  tanto  Mn 
como  Cn  son  completos.  ■ 

También  podemos  probar,  de  la  misma  forma  que  en  el  ejemplo[l.4[  que  iv ,  con  1  <  p  <  oc, 
es  un  espacio  de  Banach. 

Si  ahora  pensamos  en  los  espacios  de  funciones  y,  por  tanto,  en  sucesiones  de  funciones, 
la  idea  de  convergencia  de  una  sucesión  de  funciones  admite  ciertos  matices. 


Definición  1.5.  Sean  un  subconjunto  S  del  espacio  normado  X,  una  sucesión  de  funciones 
{fn}n> i  tales  que  fn  :  S  — »  X  y  una  función  f  :  S  — »  X .  Decimos  que  la  sucesión  {fn}n> i 
converge  puntualmente  a  f  en  S  si,  para  s  G  S,  la  sucesión  {/n(s)}n>i  converge  a  f(s);  es 
decir:  fijado  s  G  S,  para  todo  e  >  0,  existe  N  G  N  tal  que  ||/(s)  —  /n(s)||  <  e  para  n  >  N. 


Es  fundamental  observar  en  la  definición  anterior  que  la  elección  de  N  se  hace  después  de 
conocer  s  y  e,  de  modo  que  N  depende  de  ambos  valores. 

Notemos  que  si  bien  en  los  espacios  de  dimensión  finita  la  elección  de  una  norma  no 
modifica  el  carácter  de  completitud,  ya  que  todas  las  normas  son  equivalentes  (M  ,  en 
espacios  de  dimensión  no  finita  sí  puede  determinar  la  completitud  del  espacio.  Veamos  a 
continuación,  como  ejemplo,  que  el  espacio  C([a,b ])  de  las  funciones  reales  de  una  variable 
que  son  continuas  en  el  intervalo  cerrado  [a,  b]  no  es  un  espacio  completo  con  la  norma 


x 


\x(t)\2  dt 


1 

2 


Por  ejemplo,  si  [a,b]  =  [0, 1],  la  sucesión  de  funciones  continuas  {xm(t)}  definida  por 


xm(t) 


1 

2 mtm+1,  0  <  t  <  -, 

1  -2m(l  -t)m+1,  \<t<  1, 


es  una  sucesión  de  Cauchy  con  la  norma  anterior  (figura  1.1)  y  tiene  por  límite  la  sucesión 

1 


(figura  |1.2[) 


x*(t) 


0,  0  <t<-, 

1  1 

2’  2’ 

1, 


pero  x*(t)  C([0, 1]). 

Acabamos  de  ver  que  el  límite  de  una  sucesión  de  funciones  continuas  tiene  como  límite 
una  función  que  no  lo  es,  lo  que  implica  que  el  espacio  C([a,  b ])  no  sea  completo  con  la  norma 
utilizada.  La  idea  de  que  la  función  límite  conserve  las  propiedades  que  tiene  el  conjunto 
de  funciones  que  definen  la  sucesión  pasa  por  un  concepto  de  convergencia  más  sutil,  el  de 
convergencia  uniforme  que  definimos  a  continuación. 


Definición  1.6.  Sean  un  subconjunto  S  del  espacio  normado  X,  una  sucesión  de  funciones 
{fn}n> i  tales  que  fn  :  S  — »  X  y  una  función  f  :  S  — »  X .  Decimos  que  la  sucesión  {fn}n>i 
converge  uniformemente  a  f  en  S  si,  para  cada  £  >  0,  existe  N  e  N  tal  que  ||/(s)  —  fn(s)\\  <  e 
para  n  >  N  y  s  G  S . 


1.1.  ESPACIOS  DE  BANACH 


11 


Figura  1.1:  Representación  gráfica  de  xm{t). 


Figura  1.2:  Representación  gráfica  de  x*(t). 


Destacamos  que  en  la  definición  anterior  el  valor  de  N  es  el  mismo  para  todos  los  elementos 
s  6  S,  mientras  que,  en  la  convergencia  puntual,  N  depende  de  e  y  s  G  S1.  Este  hecho  va 
a  permitir  que  la  función  límite  uniforme  herede  propiedades  de  las  funciones  que  forman 
la  sucesión.  Así,  por  ejemplo,  si  {fn}n> i  es  una  sucesión  de  funciones  continuas  con  límite 
uniforme  /,  entonces  /  es  una  función  continua.  En  el  siguiente  ejemplo  utilizamos  lo  anterior 
para  ver  que  C([a,  b ])  es  un  espacio  de  Banacli  con  la  norma  del  máximo. 

Ejemplo  1.7.  El  espacio  C([a,b ])  es  un  espacio  de  Banach  con  la  norma 

ll^lloo  =  Hláx  \x(t)  I. 

t£[a,b] 

Demostración.  Sea  {xm}  una  sucesión  de  Cauchy  en  C([a,b]).  Entonces,  dado  £  >  0, 
existe  un  número  natural  N  tal  que,  para  todo  m  y  n  tales  que  m,n  >  N,  se  tiene 


\\xm  -  a^Hoo  =  máx  | xm(t)  -  xn(t) |  <  e.  (1.5) 

t£[a,b] 

Fijado  cualquier  í0  G  [a,  b], 

\xm(to)  -  xn(t0)\  <  e,  m,  n  >  N, 


y  (xi(ío)j  ^2 (¿o),  •  •  •}  es  una  sucesión  de  Cauchy  de  números  reales.  Como  M  es  completo, 
xm(t o)  — >  x(t0)  cuando  m  — >  oo.  De  esta  forma,  podemos  asociar  a  cada  t  G  [a,  b]  un  único 
x(t).  Esto  define  una  función  x  en  [a,  b\.  Veamos  que  x  G  C([a,b])  y  xm  — »  x. 

De  (1.5),  cuando  n  — >  oo,  se  tiene 


máx  I xm(t)  —  x(t)  I  <  £,  m  >  N. 

te[a,b] 


Por  tanto,  para  cada  t  G  [a,  b\,  tenemos 


xm{t)  —  x(t) |  <  £,  m  >  N, 


lo  que  implica  que  {. xm }  converge  a  x  uniformemente  en  [a,b\.  Como  las  funciones  xrn  son 
continuas  y  la  convergencia  es  uniforme,  la  función  límite  x  es  continua  en  [a,  b\.  ■ 
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Ejemplo  1.8.  También  se  puede  ver  que  los  espacios  Cn  ([a,  b ])  son  espacios  de  Banacli  con 
las  normas 

IMIoo  =  máx{||a:||,  ||a?/||, . . . ,  ||a:(n)||} 


y 

donde  ||  ■ 


llalli =  INI  +  ll^ll  +  •  •  •  +  ||x^  | 

denota  la  norma  en  C  ([a,  b]),  [8j . 


En  cálculo  se  trabaja  con  funciones  reales  definidas  sobre  un  intervalo  real.  En  análisis 
funcional,  consideramos  espacios  más  generales,  tales  como  espacios  métricos  o  normados  y 
aplicaciones  entre  dichos  espacios.  En  este  caso,  a  estas  aplicaciones  se  les  llama  operadores. 
Diremos  que  un  operador  T  aplica  el  espacio  X  en  Y  si  a  un  elemento  x  G  X  le  hace 
corresponder  un  elemento  T(x)  G  Y.  En  principio,  T  no  tiene  por  qué  estar  definido  sobre 
todo  el  espacio  X  ni  recorrer  todos  los  valores  de  Y.  Al  conjunto  de  puntos  de  X  donde  está 
definido  T  lo  llamamos  dominio  de  T,  y  lo  denotaremos  por  T>(T),  y  al  conjunto  de  valores 
de  Y  que  toma  el  operador  T  lo  llamamos  rango  de  T,  y  lo  denotamos  por  1Z(T). 

De  especial  interés  son  aquellos  operadores  que  conservan  las  operaciones  algebraicas  de 
los  espacios  donde  están  definidos. 


Definición  1.9.  Un  operador  L  que  aplica  un  espacio  lineal  X  en  otro  espacio  lineal  Y, 
ambos  espacios  sobre  el  mismo  cuerpo  K,  se  dice  lineal  si,  para  todo  x\,x2  G  X,  tenemos 


L(xi  +  x2)  =  L(x  i)  +  L(x  2), 


y,  para  todo  x  G  X  y  todo  X  G  K, 

L(Xx)  =  X  L(x). 

Es  muy  corriente  en  análisis  funcional  emplear  la  notación  Lx  en  lugar  de  L(x)  para  los 
operadores  lineales. 

Definición  1.10.  Un  operador  T  entre  dos  espacios  normados  X  e  Y  se  dice  acotado  si 
existe  un  número  real  c  tal  que,  para  todo  x  G  V(T),  se  cumple 

||T(a;)||  <  c||x||.  (1.6) 


Observamos  que  la  norma  de  la  izquierda  es  la  del  espacio  Y  y  la  de  la  derecha  la  del 
espacio  X,  aunque  las  hayamos  denotado  igual. 

Notemos  que  en  el  caso  de  operadores  acotados,  la  imagen  no  tiene  por  qué  estar  aco¬ 
tada,  lo  que  verifican  estos  operadores  es  que  transforman  conjuntos  acotados  en  conjuntos 
acotados. 

Si  X  e  Y  son  dos  espacios  lineales  sobre  un  mismo  cuerpo  K,  entonces  el  conjunto  de 
todos  los  operadores  lineales  y  acotados  entre  X  e  Y ,  que  denotamos  a  partir  de  ahora  por 
£(X,  Y),  es  un  espacio  lineal  sobre  el  cuerpo  K  con  las  operaciones 


(Li  +  L2)(x)  =  LiX  +  L2x,  para  todo  x  G  A", 

(A  L)x  =  A  (Lx),  para  todo  iGly  todo  AgK. 


A  continuación,  vamos  a  definir  una  norma  en  el  conjunto  de  operadores  acotados.  Dejando 
a  un  lado  el  caso  en  que  x  —  0,  nos  podemos  preguntar  cuál  es  el  menor  número  c  que  verifica 
(1.6).  De  aquí  surge  la  idea  para  definir  la  norma  de  un  operador. 
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Definición  1.11.  Sea  T  un  operador  acotado.  Definimos  la  norma  de  T  como 


||T||  =  ínf{c;  ||T(x)||  <  c||x||,  x  G  V{T),  x  ±  0} 


sup 

x£T>(T) 

xj^O 


M. 

||x|| 


Como  consecuencia,  si  T  es  acotado,  entonces 


Fwii<imiik 


(1.7) 


Otra  fórmula  alternativa  para  la  norma  anterior,  cuando  el  operador  T  es  lineal,  es  la 
siguiente: 

l|r||=  snp  ||T(x)||.  (1.8) 

x&V{T) 


||a;||=l 


Que  estas  fórmulas  son  equivalentes  y  que  todas  ellas  son  normas  puede  verse  en 


Además,  el  espacio  C{X,Y)  con  Y  completo  y  la  norma  (1.8)  es  un  espacio  completo 


Antes  de  considerar  propiedades  generales  de  los  operadores  lineales  acotados  veamos 
algunos  ejemplos  típicos. 


Ejemplo  1.12.  El  operador  identidad,  /  :  X  — >•  A",  definido  por  Ix  =  x,  es  un  operador 
acotado  y  su  norma  es  \\I\\  =  1. 

Ejemplo  1.13.  El  operador  cero,  0  :  X  — y  X,  definido  por  Ox  =  0  para  todo  x  G  X,  es  un 
operador  acotado  y  su  norma  es  ||0||  =  0. 

Ejemplo  1.14.  Sea  X  el  espacio  normado  de  todos  los  polinomios  en  J  =  [0, 1]  con  la  norma 
||x||  =  máx  |x(í)|,  t  G  J .  El  operador  diferenciación  T,  definido  en  X  por 

Tx(t)  =  x'(t), 

es  lineal,  pero  no  acotado.  En  efecto,  sea  xn{t)  =  tn  con  n  G  N.  Entonces  ||xn||  =  1  y 

Txn(t )  =  x'n(t)  =  nt71^1 . 


Por  tanto,  ||Txn||  —  n  y 
||  Tx, 


||  Txr 

Iknl 


=  n.  Como  n  G  N,  no  existe  un  número  fijo  c  tal  que 


\xr 


<  c.  A  partir  de  lo  anterior  y  de  (1.6),  se  concluye  que  T  no  es  acotado. 


Teorema  1.15.  )  Si  un  espacio  normado  X  es  de  dimensión  finita,  entonces  cada  ope¬ 

rador  lineal  en  X  es  acotado. 


Ejemplo  1.16.  Sean  X  =  Rm  e  Y  —  Rn.  Como  X  e  Y  son  espacios  de  dimensión  finita,  el 
conjunto  de  operadores  lineales  de  X  en  Y  es  £(X,  Y)  y,  por  tanto,  existe  una  correspondencia 
biyectiva  entre  £(X,  Y)  y  el  conjunto  Mnxm(M)  de  las  matrices  reales  de  n  filas  y  m  columnas 
de  la  siguiente  manera. 

Si  L  G  £(X,  Y)  y  A  =  (a^),  1  <  i  <  n,  1  <  j  <  m,  es  su  matriz  asociada,  entonces 

y  =  Lx  =  Ax,  para  todo  x  G  T>(X), 
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donde  x  =  (aq,  x2, . . . ,  xm)  e  X,  y  =  (t/i,  y2,  ■  ■  ■ ,  2/n)  e  T  e 

m 

Uj  ^  '  QijkXki  j  1,2 ,  ,71. 


k= 1 


Además,  la  norma  de  ||L||  viene  definida  por 


■i  r  i.  \\Lx\W  \\Ax\\y 

||L||  =  sup  — — —  =  sup  — — - 

xíV{L)  Ipll-Y  x&V{L)  \\x\\x 
x^O  x^O 


En  el  espacio  de  las  matrices  de  n  filas  y  m  columnas  podemos  definir  varias  normas.  Si 
denotamos  la  norma  en  el  espacio  X  por  ||  •  ||y  y  la  norma  en  el  espacio  Y  por  ||  •  ||y ,  diremos 
que  una  norma  ||  •  ||  en  el  espacio  de  las  matrices  es  compatible  con  ||  •  ||x  y  ||  •  ||y  si 

\\Ax\\y  <  \\A\\  IklU- 


Se  cumple  entonces  que  la  norma  definida  por 

\\Ax\\y 
=  sup  — — - — 
xex  || a; || y 
x^O 


es  compatible  con  ||  •  ||y  y  ||  • 

p°r  II  ■  IU  y  II  '  ||y- 

Si  consideramos  en  X  e  Y 


y.  Esta  norma  se  denomina  a  menudo  norma  natural  definida 


la  norma  infinito  definida  en  ( 1.2 ),  se  tiene  que  la  norma  natural 


es 

m 

\\A\\  =  máx]T  | aij 
1  j= i 


Definición  1.17.  Un  operador  T  entre  dos  espacios  normados  X  e  Y  se  dice  continuo  en 
un  punto  x  G  X  si,  para  toda  sucesión  { xn }  tal  que  lím  xn  =  x,  se  tiene  lím  T{xn)  =  T(x). 
Además,  diremos  que  un  operador  es  continuo  si  lo  es  en  todos  los  puntos  de  su  dominio. 


La  definición  anterior  generaliza  la  idea  de  función  continua  del  cálculo  en  una  variable. 
Los  operadores  lineales  tienen  la  siguiente  propiedad. 


Teorema  1.18.  Sea  T  un  operador  lineal  entre  dos  espacios  normados.  Entonces, 
(i)  T  es  continuo  si  y  sólo  si  es  acotado. 


(n)  Si  T  es  continuo  en  un  punto,  entonces  T  es  continuo  en  todos  los  puntos  de  su  dominio. 

DEMOSTRACIÓN.  Comenzamos  probando  el  apartado  (i).  En  primer  lugar,  probamos  que 
si  T  es  acotado,  entonces  es  continuo.  Para  T  =  0  resulta  trivial.  Si  T  ^  0,  entonces  ||T||  ^  0. 
Suponemos  que  T  es  acotado  y  x  G  V(T).  Dado  £  >  0,  para  cada  x  e  V(T)  tal  que 


x  —  x\\  <  S ,  donde  ó 


mr 


obtenemos,  al  ser  T  lineal, 
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Como  x  G  T>(T),  entonces  T  es  continuo. 

Recíprocamente,  suponemos  que  T  es  continuo  y  x  G  V(T).  Entonces,  dado  £  >  0,  existe 
5  >  0  tal  que 


|| Tx  —  Tx ||  <  £,  para  todo  x  G  T>(T),  cumpliendo  ||x  —  x||  <  S. 

Q 

Sea  y  G  V(T)  tal  que  y  ^  0.  Consideramos  \9\  <  5  y  x  =  x  +  jj- |j"2/  perteneciente  a  V(T) 

Q 

por  ser  T  lineal.  Como  x  —  x  =  -¡—77,  entonces  ||a:  —  x||  <  S.  Aplicando  (1.7),  por  ser  T  lineal, 

IMI 

obtenemos 


9 


\0\ 


lo  que  implica 


\\Tx-Tx\\  =  \\T(x-x)\\  =  T[jyl\y/ 

p|IM<e  y  \\Ty\\  <  j^hW- 


\\Ty\\, 


Podemos  escribir  entonces  \\Ty\\  <  c||y||,  donde  c  =  .  Y,  como  para  y  —  0  resulta  trivial, 

r  I 

T  es  acotado. 

Veamos  ahora  el  apartado  (n).  Si  T  es  continuo  en  un  punto,  por  la  segunda  parte  de  la 
demostración  de  (i),  T  es  acotado,  lo  que  implica,  de  nuevo  por  (i),  que  T  es  continuo  en 
todos  sus  puntos.  ■ 

Como  consecuencia  del  teorema  1.18,  a  los  operadores  lineales  continuos  entre  espacios 
normados  se  les  suele  llamar  también  operadores  lineales  acotados. 

A  continuación,  introducimos  los  conceptos  de  Lipschitz  continuidad  y  Hólder  continuidad 
para  un  operador. 

Definición  1.19.  Un  operador  T  entre  dos  espacios  normados  X  e  Y  se  dice  que  satisface 
una  condición  Lipschitz  (o  que  es  Lipschitz  continuo)  si  existe  una  constante  C  >  0  tal  que 


||T(a;)-T(í/)||<C'||x-í/||,  Vx,y  e  X. 


En  tal  caso,  C  se  llama  la  constante  de  Lipschitz  del  operador  T . 

Notemos  que  si  un  operador  satisface  una  condición  de  Lipschitz,  en  particular  es  continuo. 
Una  generalización  conocida  de  la  propiedad  de  que  un  operador  sea  Lipschitz  continuo 
es  que  sea  Hólder  continuo. 

Definición  1.20.  Un  operador  T  entre  dos  espacios  normados  X  e  Y  se  dice  que  satisface 
una  condición  (C,p)- Hólder  (o  que  es  (C,p)  -Hólder  continuo)  si  existen  dos  constantes  C  >  0 
y  p  G  [0, 1]  tales  que 

\\T(x)-T(y)\\<C\\x-y\\p,  Vx,y  e  X. 

En  tal  caso,  p  se  llama  exponente  de  la  condición  de  Hólder.  Observamos  que  si  p  =  1, 
entonces  el  operador  anterior  T  satisface  una  condición  Lipschitz. 

Ahora  introducimos  el  operador  inverso  de  uno  dado,  operador  fundamental  para  resolver 
ecuaciones  de  la  forma  Lx  =  y ,  donde  L  es  un  operador  lineal. 
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Definición  1.21.  Sea  L  es  un  operador  lineal  y  acotado  de  X  en  Y .  Si  existe  un  operador 
L~l  que  aplica  77(L)  en  T>(L),  de  manera  que 

L~1Lx  =  x,  para  todo  x  E  T>(L), 

LL~ly  =  y ,  para  todo  y  E  7 Z(L), 


diremos  que  L  tiene  inverso  y  que  L  1  es  el  inverso  de  L. 

Se  puede  probar  que  si  L_1  existe,  entonces  también  es  un  operador  lineal.  Una  propiedad 
algebraica  que  garantiza  la  existencia  del  inverso  es  la  siguiente:  si  de  la  relación  Lx  =  0  se 
deduce  que  x  debe  ser  cero,  entonces  L  tiene  inverso.  Esta  condición  es  además  una  condición 
necesaria  ¡3%]. 

La  condición  anterior  es  en  general  difícil  de  comprobar.  Necesitaremos  entonces  una 
caracterización  analítica  del  concepto  de  inversión.  Para  ello,  los  siguientes  resultados  son 
fundamentales  im» 

Lema  1.22.  (Lema  de  Banach)  Sea  L  un  operador  lineal  acotado  en  un  espacio  de  Banach 
X  verificando 

\\L\\<k<l. 

Entonces,  el  operador  I  —  L  tiene  inverso  continuo  y  cumple 

nt'-^rh 


Demostración.  Si  L i  y  L2  son  operadores  en  A",  entonces,  por  (1.7),  se  cumple  que 
|LiL2||  <  || ¿i || || L2 1| .  Aplicando  reiteradamente  lo  anterior,  obtenemos 


<  HUI",  n=  1,2,... 


(1.9) 


Consideramos  ahora  la  serie 


S  =  I  +  L  +  L2  +  ---  +  Ln  +  •  •  ■  , 

que  converge,  ya  que  ||L||  <  1  y  está  mayorada  por  la  serie  numérica  convergente 

i+\\L\\  +  \\Lr+...+\\Lr+... 

Como  jC( X,X)  es  completo,  S  converge  y  es  un  operador  de  £(X,X).  Además, 

S(I  -  L)  =  (/  +  L  +  •  •  •  +  Ln  +  ■■■)(/  —  L)  =  I 


y,  análogamente,  (/  —  L)S  =  /.  Por  tanto,  S  =  (/  —  L)  L  Finalmente,  por  (1.9), 


11511  <  \\I\\  +  \\L\\  +  •  •  •  +  ||Ln||  +  •••<!  +  k  +  ---  +  kn +  ■■■  = 


1  -k 


que  da  la  cota  para  (/  —  L)  1 . 


Unas  ligeras  variantes  del  lema  anterior  son  los  siguientes  resultados. 
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Lema  1.23.  Sea  L  un  operador  lineal  acotado  en  un  espacio  de  Banach  X .  Existe  L  1  si  y 
sólo  si  existe  un  operador  inversible  M  en  X  tal  que 

\\I-ML\\  <  1. 


En  este  caso, 


L"1  = 

n= 0 


y 


l|£-i  < 


JML 

1  —  J|  Z  —  ML\\ 


Demostración.  Tomando  I  —  ML  en  lugar  de  L  en  el  lema|1.22|se  asegura  la  existencia 
del  operador  continuo  inverso  de  /  —  (/  —  ML)  =  ML,  que  está  dado  por 


(ML)”1  =  ¿(/-ML)' 


n= 0 


Por  ser  M  inversible,  se  tiene 


Por  otro  lado,  teniendo  que 


L~l  =  ]T(/-ML)nM. 

n= 0 


||(ML)"1||  < 


1  -  II /  -  ML || ' 


obtenemos 

HL-1!!  =  ||L-1M-1M||  =  ||(ML)-1M||  <  ||(ML)-1||  ||M||  = 


\\M\\ 


1  -  \\I-ML\\ 

Finalmente  la  condición  necesaria  se  prueba  tomando  M  =  L”1,  ya  que 

\\I  -  ML\\  =  \\I  -  I\\  =0  <1.  U 

Lema  1.24.  Sea  L  un  operador  lineal  acotado  en  un  espacio  de  Banach  X .  Existe  L_1  si  y 
sólo  si  existe  un  operador  lineal  acotado  M  en  X  tal  que  existe  M -1  y 


\\M  —  L\\  < 


En  este  caso, 


HM-1 


L~l  =  ^(/  -M~xL)nM~ 

n=0 


I L-1!!  < 


II M 


-ii 


< 


II M 


-ii 


ma 


l-\\I-M~M\\  ~  1  -  \\M-i\\\\M  -  L\\ 

Demostración.  Para  la  condición  suficiente  tomamos  M_1  en  lugar  de  M  en  el  le- 
1.23[  cumpliéndose  entonces 

|| I  -  M_1L||  =  ||M_1(M  -  L)||  <  ||M_1|| ||M  -  L||  <  1. 


La  condición  necesaria  se  prueba  tomando  M  =  L.  ■ 
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1.2.  Diferenciación  de  operadores 


En  esta  sección  presentamos  algunos  de  los  conceptos  y  resultados  básicos  del  cálculo 
diferencial  en  espacios  de  Banach.  A  parte  del  interés  que  esta  sección  pueda  tener  por  sí 
misma,  se  establece  en  ella  el  contexto  que  permitirá  estudiar  la  aproximación  de  soluciones 
de  ecuaciones  con  operadores  no  lineales  mediante  métodos  iterativos. 

Comenzamos  dando  una  primera  definición  de  derivada  para  operadores  definidos  en 
espacios  de  Banach. 


Definición  1.25.  Dado  x0  G  X,  si  existe  un  operador  L  G  C(X,Y )  que,  para  todo  x  G  X, 
cumple 


1ítti  F(x o  +  hx )  -  F(x q) 

h — >-0  /l 


L(x), 


(1.10) 


se  dice  entonces  que  F  es  diferenciable  Gateaux  (o  diferenciable  débilmente)  en  x0.  En  esta 
situación,  el  operador  lineal  L  es  la  derivada  Gateaux  de  F  en  xq  y  denotamos  L  =  F'(x o). 


Sin  embargo,  la  derivada  Gateaux  no  es  una  buena  generalización  del  concepto  de  derivada 
para  funciones  escalares,  como  prueba  el  hecho  de  que  existan  funciones  derivables  Gateaux 
y  no  continuas.  Por  ejemplo,  la  función  F  :  M2  — »  R  definida  por 


F(x,y) 


2 

xy 

x2  +  y4  ’ 

0, 


si  (x,y)  ±  (0,0), 
si  (x,y)  =  (0,0), 


es  derivable  Gateaux  en  el  punto  (0,  0)  y,  sin  embargo,  no  es  continua  en  dicho  punto.  Para 
estar  seguros  de  que  las  funciones  diferenciables  son  continuas,  introducimos  el  siguiente 
concepto  más  fuerte  de  derivada. 


Definición  1.26.  Si  el  límite  de  la  ecuación  (1.10)  es  uniforme  en  el  conjunto  {x  G  A";  ||x||  = 
1},  entonces  se  dice  que  F  es  diferenciable  Fréchet  (o  simplemente  diferenciable)  en  x0.  En 
este  caso,  el  operador  lineal  L  =  F'(x 0)  se  llama  derivada  de  F  en  x0. 


Equivalentemente,  el  concepto  de  diferenciabilidad  se  puede  expresar  de  la  siguiente  forma. 
Dado  Xq  G  A,  si  existe  un  operador  lineal  y  continuo  L  de  X  en  Y  de  manera  que 

lím  \\F(x0  +  v)  -  F(x0)  -  Lv\\  =  Q 
IMI— >0  Ikill 

entonces  F  es  diferenciable  Fréchet  en  Xq  y  el  operador  F’(x o)  =  L  se  denomina  derivada  de 
F  en  xq. 

Como  consecuencia  de  la  definición  anterior,  tenemos  las  siguientes  propiedades  de  la 
derivada,  cuyas  demostraciones  pueden  consultarse  en  [¡27]: 

(i)  Si  F  es  diferenciable  Fréchet  en  x0,  entonces  F  es  diferenciable  Gateaux  en  xq. 

(n)  Si  un  operador  es  diferenciable  en  un  punto  x0,  entonces  es  continuo  en  dicho  punto. 

(ni)  Si  L  es  un  operador  lineal  de  X  en  Y ,  entonces  L'(x)  =  L  para  todo  x  G  X. 
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(iv)  Si  P  y  Q  son  operadores  de  X  en  Y,  la  suma  P  +  Q  es  el  operador  definido  por 
(P  +  Q)(x)  =  P(x)  +  Q(x),  x  G  A".  Si  P  y  Q  son  diferenciadles  en  xq,  entonces 

(P  +  Q)'(xo)  =  P'(x  o)  +  Q'(x  o). 

(v)  Sean  X,  Y  y  Z  espacios  de  Banach,  Q  un  operador  de  A"  en  Z  y  P  un  operador  de  Z 
en  Y.  La  composición  PQ  es  un  operador  de  X  en  Y  definido  por 

PQ(x)  =  P  (Q(x)) ,  x  G  X. 

Si  Q  es  diferenciable  en  x0  y  P  es  diferenciable  en  z0  =  Q(x0),  entonces  PQ  es  diferen¬ 
ciadle  en  x0  y 

(PQ)'(x o)  =  P'  (Q M)  Q\x o)  =  P\zQQ\x0). 

(vi)  Combinando  (iii)  y  (v)  tenemos  que  si  L  es  un  operador  lineal  acotado  de  Z  en  Y  y  Q 
es  operador  de  X  en  Z  diferenciable  en  xo,  entonces  LQ  es  diferenciable  en  xq  y 

(LQ)'(xq)  =  LQ'(x  o). 


Observamos,  por  tanto,  que  en  el  cálculo  diferencial  en  espacios  de  Banach  los  operadores 
lineales  acotados  juegan  un  papel  similar  al  de  las  constantes  en  el  cálculo  diferencial  real  o 
complejo. 

Notemos  que  si  F  es  un  operador  de  en  Mm  que,  a  una  n-tupla  (x\,X2,  ■  ■  ■  ,xn)  G 
Mn,  le  hace  corresponder  (F1(xi,x2, . . .  ,xn),  F2(x1,x2, . . .  ,xn), . . . ,  Fm(x !,x2, . . .  ,xn))  G  Mm, 
tenemos  que  la  derivada  F'  en  un  punto  Xq  =  (x]°\x2°\  . . . ,  x^J  se  representa  por  la  matriz 
jacobiana 

/  dF i  8F\  ...  dF\  \ 

dx\  8x2  dxn 


F\x  o)  = 


8Fj2  dF2 
dxi  dx2 


8F2 

dx„ 


dFm  .  .  .  dF\n 
8X2  8x„  )  x  =  x0 

(dF-  \ 

^  1  j  es  un  operador  lineal  acotado  de 

^3  /  x=xq 

Mn  en  Mm,  puesto  que  es  una  matriz  m  x  n  con  coeficientes  constantes  ¡3H¡ - 

A  continuación,  presentamos  ejemplos  del  cálculo  de  derivadas  de  operadores  en  algunos 
espacios  de  Banach. 


8Fm 
8x  i 


Ejemplo  1.27.  Sea  el  operador  P  en  C([0, 1])  definido  por 

[P(x)](s)  =  x  í  h(s,t)x(t)  dt, 
Jo 
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donde  h(s,  t )  =  —  -  y  0  <  s  <  1.  Como 


[F(x0  + hx)  -  F(x0)}(s)  =  x0(s)  f  — y—(hx)(t)  dt 

Jo  s  t 


(hx)(s) 


lo  s  +  t 


xq  (t)  dt  +  ( hx)(s ) 


'o  s  + 1 


( hx){t )  dt, 


lím  [F{x o  +  hx)  -  F(x0)]  (s) 
h->  o  h 


lím  f  Xn(s) 
h- s-0  '  v  ’ 


'o  s  +  t 


x(t)  dt 


+  x(s) 

Xo  (s 
L(x)(s 


"1 


fl 


o  s  +  t 
s 


xo(t)  dt  +  x(s) 


rl 


r  1 


o  s  +  t 


x(t)  dt  +  x(s) 


o  s  +  t 
s 


( hx)(t )  dt 


lo  s  +  t 


x0(t)  dt 


y  L  es  un  operador  lineal  acotado  en  C( [0, 1] ) ,  entonces  F  es  diferenciadle  Gateaux  en  xq. 
Además,  como 

lím  \\F(x0  +  v)  -  F(x0)  -  Lv\\  =  0 
||í)||— >o  llnll 

F  es  diferenciadle  Fréchet  en  xq. 

Ejemplo  1.28.  Definimos  el  operador  integral  de  tipo  Hammerstein  mixto  F  en  C([a,  b ])  por 

[F(x)](s)  —  x(s)  —  f(s)  —  í  G(s,t)H(t,x(t))  dt,  se  [o,  b],  (1.11) 

J  a 

para  x  e  C([a,b]),  donde  /  es  una  función  dada,  G(s,t )  es  el  núcleo  de  un  operador  integral 
lineal  en  C([a,  6])  y  H(t,u )  es  una  función  continua  para  t  €  [a,  b]  y  u  €  (— oo,  oo).  Como 

[F(x0  +  hx)  —  F(x0)](s)  =  hx(s)  —  j  G(s,t)^H(t,x0(t)  +  hx(t))  —  H(t,x0(t))^  dt, 

lim  ¡túiiMxLÍDM  =  x(s)  _  f  GM  +  dt 

h^o  h  Ja  \h^0  h  J 

rb 

=  x(s)  —  /  G(s,  t)H'2(t,  xo(t))  x(t)  dt 

J  a 

=  [L(x)](s), 

y  L  es  un  operador  lineal  acotado  en  C([a,b]),  entonces  F  es  diferenciadle  Gateaux  en  x0. 
Además,  como 

lím  \\F{xq  +  v)  —  F(xp)  —  Lv\\  =  Q 
||í)||->o  ||n|| 

F  es  diferenciadle  Fréchet  en  xq. 

Ejemplo  1.29.  Consideramos  ahora  el  operador 


{F(x)m  = ‘FF  +  4,(x(t)) 


(1.12) 
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de  C2([a,b ])  en  C([a,b]),  donde  (j>{u)  es  una  función  continua  para  u  G  (—00, 00).  Como 

[F(x0  +  hx)  -  F(x0)](t)  =  h  d ^  +  ^(xo(0  +  hx(t))  -  <j>(x0 (¿)), 

[F(x0  +  hx)  -  F(x0)](t)  d2x(t )  0(xo(í) +  /ix(í)) -  0(xo(í)) 

lnn - 7 -  =  — 7-7 - h  lnn - 7 - 

h->o  h  dt¿  o  /?, 

=  ^-^  +  <PMt))x(t) 

=  [L(x)](t), 

y  L  es  un  operador  lineal  acotado  en  C([a,b]),  entonces  F  es  diferenciable  Gateaux  en  x0. 
Además,  como 

lím  \\F(x0  +  v)  -  F(x0)  -  Lv\\  =  Q 
H-t-ll— í-o  llnll 

F  es  diferenciable  Fréchet  en  xq. 

Por  otra  parte,  uno  de  los  resultados  que  se  pierden  al  pasar  de  los  números  reales  a 
espacios  más  generales  es  el  Teorema  del  Valor  Medio,  que  asegura  que  si  /  es  una  función 
diferenciable  en  un  intervalo  [a,  b] ,  entonces 

f(b)  —  f(a)  =  f'{£){b  —  a),  donde  £  G  (a,b). 

Veremos  ahora  una  desigualdad  que  generaliza  al  Teorema  del  Valor  Medio.  Para  ello, 
dados  dos  puntos  x  e  y,  definimos  el  segmento  que  los  une  como 

[x,y]  =  {x  +  9(y-x)]9  G  [0,1]}. 

Diremos  que  un  conjunto  ó  es  convexo  si,  para  cualesquiera  1,1/GÍl,  el  segmento  [x,y]  que 
une  x  e  y  está  contenido  en  ó. 

Teorema  1.30.  (Teorema  del  Valor  Medio)  Sean  X  e  Y  dos  espacios  de  Banach  y  F  :  X  -A  Y 
un  operador  diferenciable  en  un  conjunto  convexo  Í1  C  I.  Entonces,  si  xq,x\  G  ó,  se  tiene 

||F(a;i) -F(x0)||  <  sup  ||F'  (x0  +  6*(xi  -  ar0))||  ll^fi  -  ar0||- 
0<6»<1 

Demostración.  Dada  una  función  lineal  acotada  g  :  Y  -a  M,  definimos: 

Ó(í)  =  g(F(x0  +  tv)),  v  =  x!-x0,  í  G  [0,1]. 

Teniendo  en  cuenta  que  g'  =  g  por  ser  lineal,  se  obtiene 

4>'{t)  =  9  (F> {x o  +  tv)(v)) . 

Aplicando  ahora  el  Teorema  del  Valor  Medio  a  q í>,  se  sigue 

<¡>{i)-m  =  4>,{0),  o < ú <  1, 

y  sustituyendo  por  sus  expresiones,  se  tiene 


9  (Hxi)  ~  F(x 0))  =  g  (F'(x 0  +  6v)(v)) . 
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Por  tanto, 


\g  (F(x1)  -  F(x0))\  <  ||#||  sup  \\F'  (xo  +  Ov)  ||||n|| 

0«9<1 

Por  el  Teorema  de  Hanh-Banach  [2H],  podemos  elegir  g  0  tal  que 


g(F(x1)-F(xa))  =  \\g\\\\F(xl)-F(x„)\\. 


Y  finalmente, 


||F(>i)  -  F(x0)||  <  sup  \\F'  (x0  +  0(x\  —  x0))||  ||xi  —  x0||.  ■ 

0<6><1 

Corolario  1.31.  Con  la  notación  anterior  se  tiene  que 


||F(xi)  -  F(x o)  -  F\x)(x i  -  x0)|| 


<  sup  \\F' (x0  + 9(xi  —  x0))  —  F'(x)\\\\xi  —  x0\\  con  xe[a;o,^i]. 

O<0<1 


La  demostración  del  corolario  anterior  se  obtiene  aplicando  el  teorema  1.30  al  operador 
F-F'(x). 


Si  F  es  un  operador  diferenciable  entre  dos  espacios  de  Banach  X  e  Y,  entonces  podemos 
interpretar  F'  como  un  operador  de  X  en  C(X,  Y).  El  espacio  C(X,  Y r)  también  es  un  espacio 
de  Banach  con  la  norma 

||L||  =  sup  \\Lx\\. 

\\x\\  =  l 

En  consecuencia,  se  puede  pensar  en  derivar  el  operador  F'.  El  resultado  de  derivar  este 
operador  en  un  punto  xq  es  lo  que  se  conoce  como  la  derivada  segunda  de  F  en  xq  y  se  suele 
denotar  por  F"(x 0). 

Observamos  también  que  F"(x0)  G  C  (X,  C(X,  Y ')),  y  así  tenemos  que  F"  es  un  operador 
de  X  en  C(X,C(X,Y)),  que  también  es  un  espacio  de  Banach.  Si  volvemos  a  derivar  este 
operador  en  un  punto  xo,  obtenemos  la  derivada  tercera  F'"(x o).  Continuando  este  proceso, 
en  el  caso  de  que  existan  las  derivadas  que  van  apareciendo,  se  obtienen  las  derivadas  de 
órdenes  superiores,  cuyo  estudio  no  vamos  a  desarrollar,  dado  que  no  se  van  a  utilizar  a  lo 
largo  de  todo  este  texto.  Los  estudiantes  interesados  pueden  consultar  [2 7]. 


1.3.  Integración  de  operadores 

A  continuación  comentamos  algunos  aspectos  sobre  el  cálculo  integral  en  espacios  de 
Banach.  En  primer  lugar,  definimos  la  integral  en  el  sentido  de  Riemann  para  una  función 
de  variable  real  y  con  valores  en  un  espacio  de  Banach.  A  continuación,  apoyándonos  en 
la  definición  anterior,  definimos  la  integral  de  una  función  entre  dos  espacios  de  Banach  en 
general. 

Definición  1.32.  Sea  F  definida  en  un  intervalo  real  [a,  b]  y  con  valores  en  un  espacio  de 
Banach  Y.  Entonces  podemos  definir  la  integral  de  F  como  el  límite  de  la  siguiente  suma 


n—  1 


X!  F{rk)(tk+ 1  -  4), 

k= 0 
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donde  a  =  t0  <  4  <  ■  ■  ■  <  tn  =  b  y  rk  €  [4,  4+i]>  cuando  máx{4+i  —  4}  tiende  a  cero.  Si  el 

(fc) 

límite  anterior  existe,  lo  llamamos  integral  de  F  y  lo  denotamos  por 


F(t )  dt. 


Evidentemente,  si  la  integral  existe,  es  un  elemento  de  Y.  Una  condición  suficiente  para 
que  exista  dicha  integral  es  que  la  función  F  sea  continua  en  el  intervalo  cerrado  [a,  b ]. 

Las  propiedades  de  esta  integral  se  deducen  de  las  conocidas  para  la  integral  de  Riemann 
en  el  caso  real.  De  entre  ellas,  destacamos  las  siguientes  tres  por  su  utilidad  [23: 


(i)  Si  consideramos  un  operador  lineal  y  acotado  L  €  £(Y,  Z),  entonces 


f\(F{t))  dt  —  L  F(t)  dtj  . 


(■ ii )  Si  F(t)  =  (f>(t)yo,  donde  y0  es  un  elemento  fijo  de  Y  y  0  es  una  función  real  integrable, 
entonces 


F(t)  dt  =  yo  í  0(t)  dt. 

J  a 


yin) 


F{t)  dt 


<  /  11^)11  df- 


Definición  1.33.  Supongamos  ahora  que  T  es  un  operador  definido  en  un  segmento  [ícq,  aq]  Q 
X  y  con  valores  en  el  espacio  C(X,Y).  En  este  caso,  definimos: 


rx  i  r  1 

/  T{x)dx—  /  T  (x0  +  t(xi  —  x0))  (xi  —  xq)  dt. 

J  x  o  J  0 

Notemos  que  la  función  T  (xo  +  [-]  (a?i  —  Xq))  (a; i  —  xo)  está  en  las  condiciones  de  la  defi¬ 
nición 


1.32  con  [a,  6]  =  [0, 1]. 


Si  en  la  definición  anterior  se  considera  el  caso  particular  T  —  F' ,  donde  F  es  un  operador 
de  X  en  Y  que  tiene  derivada  continua  en  el  segmento  [xo,Xi],  tenemos  el  siguiente  teorema 
que  generaliza  la  conocida  regla  de  Barrow  del  cálculo. 


Teorema  1.34.  Si  F  es  un 

[x0,xi\  CX,  entonces 


operador  de  X  en  Y  con  derivada  continua  en  el  segmento 


F'[x)  dx  =  F(x i)  —  F(xq). 


(1.13) 


Demostración.  Sea  0  =  t0  <  t\  <  ■  ■  ■  <  tn  =  1  una  partición  del  intervalo  [0, 1]  con 
A  =  máx  {4+1  -  4}  y  Tfc  £  [4,4+i]-  Entonces, 

0<k<n— 1 


71—1 

lim  F>  OU)  +  rk(xt  -  x0))  (xi  -  x0)(4+i  -  4) 

A^°  fc=0 

71—1 

lím  F'(xk)  Axk, 

k= 0 
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donde  xk  =  xg  +  rk(x i  —  xg )  y  Ax*,  =  (4+1  —  tk)(x i  —  xo)  para  k  —  0, . . . ,  n  —  1.  Por  otro 
lado, 

TI— 1 

F(xi)  -  F(x0)  =  [F  {xo  +  tk+1(x1  -x0))  -F(x0  +  4(xi  -x0))] 


fe=0 
n— 1 


=  EPI^O-fWI, 

k= 0 


donde  x^  =  xq  +  4(xi  —  %o)- 


Aplicando  el  corolario  1.31,  como  xk  G  [x^,  Xfc+i],  se  tiene 


||F(xfc+i)  -  F(xk)  -  F,(xfc)Axfc||  <  ¡I Axfc||  sup  ||F'(xfe  +  9 Axk)  -  F(xfc)|| 

0<6»<1 

=  |||xi  —  x0|| (tk+1-tk)  sup  \\F'(xk  +  QAxk)  -  F'(xk)\\, 

o<e<i 

de  manera  que 


n—  1 


iF(xk+i)  -  F(xk)  ~  F'(xk)Axk\ 

k= 0 


n—  1 


<  ^2  ||F(xfc+i)  -  F(xk)  -  F\xk) Axfc|| 


k= 0 


n—1 


<  ||  Xi  —  Xo  II  ^(4+i  -  tk)  sup  HF^Xfe  +  0Axk)  -  ^7(xfc)  ||. 

k= o  o<e<i 


Como  F'  es  continuo  y  también  uniformemente  continuo  en  [xo,xt],  ¡22],  considerando  el 
limite  cuando  A  — »  0,  se  obtiene  el  resultado.  ■ 

Corolario  1.35.  (Integración  por  partes)  Si  P(t )  es  un  operador  de  [a,  b]  en  Y  y  Q(t )  es 
una  función  escalar  tales  que  P'(t )  y  Q'(t)  son  integrables,  entonces 

P(b)Q(b)  -  P(a)Q(a )  =  f  P(t)Q\t )  dt  +  f  P\t)Q(t )  dt.  (1.14) 

Ja  Ja 

Demostración.  Si  F(t)  =  P{t)Q{t ),  entonces  F'(t)  =  P(t)Q'(t )  +  P'(t)Q(t).  Aplicando 


ahora  el  teorema  1.34  tenemos 

rb 


í  F'(t )  dt  =  F(b )  -  F(a )  =  P(b)Q(b)  -  P{a)Q{a). 

J  a 


Por  otro  lado,  de 

rb  rb 


F'(t)  dt  =  í  (P(t)Q'(t)  +  P'(t)Q(t))  dt  =  f  P(t)Q'(t)dt+  f  P\t)Q(f)dt , 

Ja  Ja  Ja 

se  deduce  el  resultado.  ■ 

De  la  propiedad  (m)  de  la  integral  se  sigue  el  siguiente  resultado  que  nos  permite  acotar 
la  integral  de  un  operador  que  esté  acotado  por  una  función  real. 


Lema  1.36.  Sea  T  un  operador  en  las  condiciones  de  la  definición  1.33  y  <p{t)  una  función 
real  definida  en  [0, 1]  e  integrable.  Si 

||T(x0  +  t(xi  —  x0)) ||  <  ó(í0  +  t(íi  -í0)),  t  G  [0, 1],  y  ||xi  —  x0||  <  4  -  £0, 
entonces 


rx  i 


T(x)  dx 


ix0 


rti 

<  I  4>(t)  dt. 
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Demostración.  En  efecto, 


rx  i 


T(x)  dx 


’XQ 


< 

< 


í  T(x0  +  t(x  1  -  x0))  (aq  -  x0)  dr 
Jo 

í  ||T  (xo  +  t(xi  —  x0))||  \\xi  —  x0||  dr 
Jo 

í  Ó  (to  +  T(ti  ~  to))  (ti  ~  to)  dr 

Jo 


/to 


(j>(t)  dt. 


Como  caso  particular  del  lema  anterior,  tenemos  el  siguiente  resultado. 
Corolario  1.37.  Si  se  cumple  la  desigualdad 

m*)ii  <m 

para  x  y  t  tales  que  \\x  —  x0||  <  t  —  f0,  entonces 


rx  i 


T{x)  dx 


'xq 


< 


rt  i 


/to 


4>{t)  dt , 


donde  X\  es  un  elemento  tal  que  ||xi  —  x0||  <  t\  —  t0. 

Demostración.  Si  x  e  [xo,a;i]  y  fe  [í0)íi],  entonces 

x  =  x0  +  t(x i  —  Xq)  y  t  —  t0  +  T(ti~t0)  con  re  [0,1], 

de  manera  que 

||x  -  x0||  =  r||xi  -  x0||  <  r{t\  -  í0)  =  t  -  t0,  r  G  [0, 1]. 

Por  consiguiente, 

II T  (x0  +  t(x  1  -  x0))||  <  0(ío  +  t(íi  -  to))  ,  T  e  [0, 1], 

y  se  satisfacen  las  condiciones  del  lema  anterior,  del  que  se  sigue  el  resultado.  ■ 

Terminamos  con  el  Teorema  de  Taylor.  Aunque  hay  varios  enunciados  similares  [T3J,  hemos 
elegido  el  siguiente  por  su  comodidad  a  la  hora  de  utilizarlo. 

Teorema  1.38.  (Teorema  de  Taylor)  Supongamos  que  F  es  un  operador  n  veces  diferenciable 
en  la  bola  B(x o,  r)  y  que  F ^  es  integrable  en  el  segmento  [xq,  or]  con  x\  e  B[x o,  r).  Entonces, 


n—  1 


F(x i)  =  F(x0)  +  T,F{k\xo)(xi  -  xo)k  +  Rn(x 0,Xi), 
tF[  k\ 


(1.15) 


donde 


Rn(x0,x i)  =  - - —  í  F[n\x){;x1  -  x)n  1  dx 

(■ n  -  1)!  Jx o 


(n-  !) 


¡Jo  F{n)  (®o  +  t(xí  -  x0))  (X!  -  X0)n(l  -  t)n  1  dt. 


(1.16) 
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DEMOSTRACION.  Procedemos  por  inducción.  Para  n  —  1,  por  el  teorema |1.34[  se  cumple 
trivialmente.  Suponemos  que  es  cierto  para  n  =  m  —  1.  Consideramos  ahora  la  función  escalar 


cuya  derivada  es 


Además,  si 


entonces 


Q{t)  = 


Q'(t)  = 


(i  -t) 


m—  1 


(m  —  2)! 

P(t)  =  Fl”*"1)  (x0  +  t(x,  -  x„))  (x,  -  lo)”"1, 
P\t)  =  F<”*>  (l0  +  í (n  -  !„))  (n  -  x„)”. 


(1.17) 

(1.18) 


De  (|1.16[),  (Jl.l7|)  y  (|1.18|),  se  sigue 

Rm- i(t0,xi)  =  -  /  P(t)Q'(t)dt. 
Jo 


Aplicando  ahora  la  fórmula  de  integración  por  partes  (1.14),  se  deduce 

Rm-1  (xo,  Xi)  =  -P(1)Q(1)  +  P(0)Q(0)  +  í 1  P'(t)Q(t)  di 

2o 


1)(rro)(a;i  —  x0) 


m—  1 


(m  —  1)! 

+  7  1  ^  i'  F ^  (x0  +  t(Xl  -  x0))  {Xl  -  x0)m(l  -  i)"1"1  dt 

[m  —  1  !  2o 


(m  —  1)! 


F(m  1}(x0)(xi -x0)ro  1  + 


Esto  establece  (1.15)  por  inducción,  con  lo  que  queda  probado  el  teorema. 


Notemos  que  (1.15)  es  equivalente  a 


F Oí)  =  F(x0)  +  ¿  —  F{k\x0)(x1  -  x0)k  +  Rn(x 0,xi), 


fc=i 


donde 

Rn(xo,  xi)  =  7^ -j-  J  (F(n\x)  -  F(n)(x0))  (xi  -  x)n_1  dx. 

1.4.  Diferencias  divididas 

En  esta  sección  trataremos  resumidamente  alguno  de  los  conceptos  que  posteriormente 
serán  utilizados  en  el  desarrollo  de  este  texto.  Somos  conscientes  de  que  lo  aquí  abordado 
necesita  de  un  desarrollo  más  detallado  del  presentado.  Es  por  ello  que  fundamentalmen¬ 
te  nos  esforzaremos  simplemente  en  resumir  ordenadamente  algunos  de  los  resultados  que 
posteriormente  se  utilizan. 
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El  concepto  de  diferencia  dividida  en  espacios  de  Banach  fue  introducido  por  J.  Schroder 
m  generalizando  el  concepto  de  diferencia  dividida  de  una  función  escalar  de  la  misma  forma 
que  la  derivada  Fréchet  de  un  operador  en  espacios  de  Banach  generaliza  el  de  la  derivada 
de  una  función  escalar. 

Así,  de  forma  natural,  al  considerar  una  diferencia  dividida  como  una  aproximación  de  una 
derivada,  si  F  es  un  operador  entre  dos  espacios  de  Banach  X  e  Y ,  a  partir  de  la  estimación 

F(x)&F(y)  +  F'(y)(x-y)  =>  F(x)  -  F(y)  »  F'(y)(x  -  y) 

y  teniendo  en  cuenta  que  F'(y)  G  £(X,  Y'),  es  claro  que  una  diferencia  dividida  en  espacios  de 
Banach,  al  ser  una  aproximación  de  la  derivada,  debe  ser  un  operador  lineal  acotado  de  X  en 
Y  que,  al  aplicarlo  a  (x  —  y),  es  igual  a  F(x)  —  F(y).  Definimos  formalmente  a  continuación 
el  concepto  de  diferencia  dividida  de  primer  orden  de  un  operador  F  en  espacios  de  Banach. 

Definición  1.39.  Sean  X  e  Y  dos  espacios  de  Banach,  F  :  O  C  X  — >•  Y  un  operador  y  fl 
un  subconjunto  abierto  convexo  no  vacío  de  X.  Se  dice  que  un  operador  0  G  C(X,Y)  es  una 
diferencia  dividida  de  primer  orden  de  F  en  los  puntos  x  e  y,  x  ^  y,  si 


&(x-y)  =  F(x)  -  F(y). 


(1.19) 


En  adelante,  si  0  G  jC(X,  Y)  es  una  diferencia  dividida  de  primer  orden  del  operador  F 
en  los  puntos  x  e  y,  la  denotaremos  también  por  0  =  [x,  y ;  F], 

La  condición  (1.19)  no  determina  la  unicidad  de  la  diferencia  dividida  a  menos  que  la 
dimensión  de  A"  sea  uno  (diferencia  dividida  en  M).  Se  puede  probar  que  si  dim(A)  =  d 
y  dim(Y')  =  d! ,  entonces  existen  d'(d  —  1)  +  1  operadores  lineales  de  E\  en  E2,  donde  E\ 
es  un  espacio  normado  completo  y  E2  es  un  espacio  normado,  cumpliendo  (1.19)  y  que  son 
linealmente  independientes  1 37:  . 

Podemos  consultar  [7]  para  la  existencia  de  diferencias  divididas  de  un  operador  y  ¡46j  para 


ejemplos  en  algunos  espacios  particulares.  A  continuación,  damos  dos  ejemplos  en  espacios 
de  dimensión  finita. 


Ejemplo  1.40.  Consideramos  el  caso  X  —  Y  — 
dor  F  por  Ej  y  F2.  Es  decir, 


y  denotamos  las  componentes  del  ópera- 


para  x  = 


tenemos  F(x)  = 


Fi(x\,  x2) 

F2{xi,x2) 


Entonces,  cada  uno  de  los  operadores  lineales  Ai  y  A2,  dados  respectivamente  por  las  matrices 


A]_  = 

f  Fi(xi,y2)  ~  Fi{yi,y2) 
X\  ~  Vi 

F2{xi,y2)  -  F2(y\ ,  y2) 

Fl(xi,x2)  —  Fi(xi,í/2)  \ 

-  V2 

F2{x i,x2)  -  F2{x i,t/2) 

V  xi-yi 

x2-y2  / 

(  Fx{x i,x2)  -  Fi{yi,x2) 

Fi(yi,x2)  -Fí(y1,y2)  \ 

A2  = 

xi  -  yi 

X2  -  V2 

F2(x i,x2)  -  F2(yi,x2) 

F2(yi,x2)  ~  F2(yuy2 ) 

V  xi-yi 

X2~V2  / 
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verifican  (1.19). 

Por  otra  parte,  si  F  es  diferenciable  y  su  derivada  Fréchet  F'  es  continua  en  el  segmento 
[x, y\  =  {x  +  t(y  —  x); t  G  [0, 1]},  el  operador  lineal  dado  por 


A3  =  I  F'(x  +  t(y  —  x))dt 
Jo 


también  verifica  (1.19).  Esto  significa  que  cualquiera  de  los  tres  operadores  anteriores  son 
diferencias  divididas  del  operador  F  en  los  puntos  x  e  y.  Además,  cualquier  combinación 
convexa  de  Ai,  A2  y  A3  es  también  una  diferencia  dividida  de  F  en  x  e  y. 


Ejemplo  1.41.  Sea  D  un  dominio  abierto  de  W1  y  F  un  operador  definido  en  D  con  valores 
en  Mn  y  tal  que  F(x)  =  (Ej(x), . . . ,  Fn(x)). 

Sean  x  e  y  dos  puntos  distintos  de  D  y  definimos  [x,  y,  F]  como  la  matriz  con  entradas 

\x,  y ,  F]ij  —  . . . ,  Xj,  r/j_|_i, . . . ,  yn )  A¿(xi,  •  •  •  i  -^j— u  Uji  •  •  ■  •>  Un)')  ■ 

Xj  —  y.j 


Es  sencillo  comprobar  que  el  operador  anterior  [x,y,F]  G  £(Mn,Mn)  verifica  la  condición 
(1.19).  En  efecto,  vemos  que  se  cumple 


([x,  y,  F](x  -  y))i  =  (F(x)  -  F(y))i , 


puesto  que 

([x,  2/;  F](x-r/))¿ 


Z)[x,í/;  F\iAxJ~yj) 

3= 1 
n 

(A¿(x i, . . . ,  Xj,  yj-\. i, . . . ,  ?/n)  —  F¿(x i, . . . ,  x j — i ,  yj, ... ,  yn )) 

i=i 


(F¿(xi,  y2, . . . ,  yn)  -  Fi(y1,y2, ...,  yn)) 


+  (F¿(xi,  x2,y3,  ...,yn)~  Fi(x1,y2, . . .  ,yn)) 

{^Fi (xi , ... ,  xn—i ,  yn )  Ej (xi ,  ...  ,  Xn_2 ,  yn— 1 ,  Vn)') 

+  (E¿(xi, . . .  ,xn)  -  E¿(xi, . . .  ,xn_i,r/n)) 

=  F¿(xi, . . .  ,xn)  -  FíÍj/í,  . . .  ,yn) 


=  (F(x)-F(y))i. 

A  menudo,  se  requiere  que  la  aplicación  [-,-;E]  :  X  x  Y  — >  C(X,Y )  tal  que  (x,y)  — > 
[x,y;F]  G  C(X,Y)  satisfaga  una  condición  Lipschitz  en  algún  dominio,  lo  que  implica  que 
el  operador  F  sea  diferenciable,  tal  y  como  veremos  después.  Nosotros  utilizaremos  dicha 
condición  en  la  forma  en  que  lo  hace  Laarsonen  en  ¡3U| . 


Definición  1.42.  Sean  X  e  Y  dos  espacios  de  Banach,  F  :  C  X  — >  Y  un  operador, 

fl  un  subconjunto  abierto  convexo  no  vacío  de  X  y  x  e  y  dos  puntos  distintos  de  Í2  que 


1.4.  DIFERENCIAS  DIVIDIDAS 


29 


tienen  asociada  una  diferencia  dividida  de  primer  orden  [x,y,F]  G  C(X,Y).  Diremos  que  la 
diferencia  dividida  de  primer  orden  [x,  y,  F ]  es  Lipschitz  continua  en  Í2  si  existe  una  constante 
K  >  O  tal  que 

\\[x,y,F]  -  [u,v,F]\\  <  K(\\x-u\\  +  ||2/  —  v||);  Vx,y,u,v  G  Í2;  x^y,u^v.  (1.20) 

Veamos  en  el  siguiente  lema  que  la  condición  anterior  implica  que  F  es  diferenciable 
Fréchet  en  Í2, 


Lema  1.43.  Sean  X  e  Y  dos  espacios  de  Banach,  F  :  Í2  C  X  — »  Y  un  operador,  Í2  un 
subconjunto  abierto  convexo  no  vacío  de  X  y  x  e  y  dos  puntos  distintos  de  Í2  que  tienen 
asociada  una  diferencia  dividida  de  primer  orden  [x,y,F]  G  C(X,Y)  cumpliendo  (1.20). 
Entonces, 

[x,  x;  F]  =  F'(x),  (1.21) 

II F\x)  -  F\y) ||  <  2 K  ||x  -  y\\,  K  >  0.  (1.22) 

Demostración.  Sea  x  G  ÍL  Si  K  >  0,  elegimos  e  >  0  tal  que  B(x,  e/K)  c  Í2  y  denotamos 
ó  =  e/K.  Para  ||Ax||  <  ó,  se  tiene  entonces 

\\F(x  +  Ax)  —  F(x)  —  [x,x\  F]  (Ax)||  =  ||  [x  +  Ax,  x;  F]  (Ax)  —  [x,  x;  F](Ax)|| 

=  ||  ([x  +  Ax,  x;  F]  —  [x,  x;  F])  (Ax)|| 

<  ||  [x  +  Ax,  x;  F]  —  [x,  x;  F]||  ||Ax|| 

<  K  || Ax||  || Ax || . 

Esta  condición  prueba  (1.21[)  cuando  K  0  y  ||Ax||  — >  0,  puesto  que 

||F(x  +  Ax)  —  F(x)  —  [x,  x;  F](Ax) 


lím 

II  Aaj||— >0 


||  Ax|| 


=  0. 


Si  K  =  0,  por  (1.20),  existe  un  operador  L  e  C{X,  Y)  tal  que  [x,  y;  F]  —  L  para  todo  x,  y  G  0. 
Entonces,  por  (1.19),  podemos  tomar  cualquier  5  en  lo  anterior  y  se  tiene  Ff  x)  =  L. 

Para  completar  la  demostración  vemos  (1.22).  Sean  x,i/GÍly,  por  (1.20),  tenemos 

||F'(x)  -  F\y) ||  =  ||  [x,  x;  F]  -  [y,  y  F]||  <  K  (||x  -  y\\  +  ||x  -  2/11)  =  2A^||x  -  y\\.  U 

Notemos  que  en  las  condiciones  indicadas  se  tiene  que  F'  cumple  una  condición  Lipschitz 
de  la  forma  (1.22)  con  constante  de  Lipschitz  2 Ií. 

Una  consecuencia  inmediata  de  (1.20)  y  (1.21)  es: 

\\[x,y,F]  -  F\z)\\  <  K  (\\x  -  z\\  +  \\y  -  z\\) ,  K>  0,  Vx,y,zGÍL  (1.23) 

Recíprocamente,  si  suponemos  que  F  es  diferenciable  Fréchet  en  Í2  y  que  su  derivada 
Fréchet  satisface  (1.22),  entonces  se  sigue  que  F  tiene  tiene  una  diferencia  dividida  de  primer 
orden  Lipschtz  continua  en  fl.  En  efecto,  para  ello,  podemos  tomar  por  ejemplo 

[x,y;F\—  I  F'(x +  t(y  —  x))dt.  (1-24) 

Jo 


Sin  embargo,  con  la  excepción  del  caso  dirri(V)  =  1,  sabemos  que  (1.24)  no  es  la  única 
diferencia  dividida  de  primer  orden  Lipschitz  continua  de  F. 
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Ejemplo  1.44.  En  el  ejemplo  1.28  hemos  visto  que  el  operador  (1.11)  es  diferenciable  con 
derivada 

[F'(x0)  x](s)  =  x(s)  —  f  G(s,t)  x0(t))  x(t)  dt. 


Si  utilizamos  (1.24),  se  sigue 


([x,  y ;  F)  -  [u,  v;  F])  z(s)  =  f  ( F\y  +  r(x  -  y))  -  F'(v  +  r(u  -  v)))  z(s )  dr 

Jo 

=  -  Jo  (ja  G(s,t)  (y  +  t(x  -  y))(t))  -  H'fit,  (v  +  r(u  -  v))(t)))  z(t)  dt)  dr. 


Suponiendo  ahora  que  H'2  es  Lipschitz  continua  con  constante  de  Lipschitz  C  y  teniendo  en 
cuenta 

\\[x,y;F]  -  [u,v,F]\\  =  sup  \\([x,y,F}  -  [u,v,F])  z\\ ,  (1.25) 


[x,y,F\  -  [u,v;F])  z\\  <  C 


<  C 


<  £ 
“  2 


í  G(s,t)dt  í  \\y  +  r(x  —  y)  —  (v  +  r(u  —  v))\\  dr  \\z\ 
Ja  Jo 

f  G(s,t)dt  f  \\r(x  —  u)  +  (1  —  r)(y  —  v))\\  dt  \\z\\ 

Ja  Jo 


G(s,  t )  dt 


\x  -  «II  +  II y  -  «ID  INI, 


se  sigue  que  la  diferencia  dividida  de  primer  orden  [x,y,F]  es  Lipschitz  continua  en  C([a,  b]) 

C  rb 

con  constante  de  Lipschitz  —  /  G(s,t)dt 

2  Ja 

En  el  siguiente  teorema  se  da  una  caracterización  de  las  diferencias  divididas  de  primer 


orden  de  la  forma  (1.24), 

Teorema  1.45.  Sea  :  O  XÍ2  — y  C(X,Y )  un  operador  que  satisface  las  condiciones 

{1.19)  y  (1.20).  Las  siguientes  afirmaciones  son  equivalentes 

(i)  La  igualdad  (1.24)  se  cumple  para  todo  x,y  G  ÍL 

(ii)  Para  todo  par  de  puntos  u,v  G  12  tales  que  2v  —  u  G  Ll,  se  tiene 

[u,  v,  F]  =  2 [n,  2v  —  u]  F]  —  [u,  2v  —  u]  F].  (1-26) 


Demostración.  Sustituyendo  w  =  v  —  u,  podemos  reescribir  (1.26)  de  la  forma 
[tí,  ti  +  tu;  F]  +  [tí  +  tu,  ti  +  2w,  F]  =  2  [tí,  tí  +  2tu;  F]  . 

Entonces,  la  implicación  (i)  =^(ii)  se  sigue  de  forma  inmediata  observando  que 


(1.27) 


[  F'(u  +  tw)dt+  [  F'(u  +  w  +  tw)dt  =  lím 
Jo  Jo  n 


3= 1 


yP  F\u  +  —w)  +  yp  F\u  +  w  +  —w) 


3= 1 


J 

n 


1  2n  7 

=  2  lím  — F'(u  +  —2w) 
n  2  n^.  v  2  n  ’ 

3= 1 

=  2  í  F'(u  +  t2w)dt. 

Jo 
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Para  probar  la  implicación  (ii)=^(i),  observamos  en  primer  lugar  que  (1.27)  implica 


T\u,u  +  2"w,F\  =  Y.  [u  +  (j  +  l)w,u  +  jw;  F],  para  todo  n  G  N.  (1-28) 

3= 1 

Esto  se  puede  probar  fácilmente  por  inducción.  Para  verlo,  consideramos  los  primeros  cuatro 
sumandos.  Teniendo  en  cuenta 

[u,  u  +  w\  F]  +  [u  +  w,  u  +  2 u;  F]  +  [u  +  2 w,  u  +  3 w;  F]  +  [u  +  3 w,  u  +  4w;  F] 

=  2[u,u  +  2w;  F]  +  2[u  +  2 w,  u  +  4 u>;  F]  =  4  [u,  u  +  4 w;  F] , 
es  obvio  que  se  sigue  la  inducción. 

Consideramos  ahora  la  igualdad  (1.28)  para  u  =  x  y  w  =  2 ~n(y  —  x)  y  utilizando  (1.23), 
obtenemos 


[x,  y\ F\ 


2~n  YX=í  F'{x  +  jw)  ||  =  F\\Y%F{[x  +  (j-l)W)X  +  kw-F\-F\x  +  jw))\\ 

<  2~n2nk\\w\\  =  ±k\\y-X\\. 


Ahora,  si  n  — >  oo,  obtenemos  (1.24).  ■ 

A  continuación,  exponemos  brevemente  algunas  condiciones  de  tipo  Lipschitz  para  las 
diferencias  divididas  de  primer  orden  que  han  sido  utilizadas  por  otros  autores. 

La  condición  Lipschitz  (1.20)  ha  sido  utilizada,  por  ejemplo  en  ¡2ü],  [3¡DJ  y  [3B].  Utilizando 

y  Sergeev  en  [43]  generalizan  el 


la  noción  anterior  de  diferencia  dividida,  Schmidt  en 
conocido  método  de  la  secante  a  espacios  de  Banacli.  Para  probar  la  convergencia  de  dicho 
método  ambos  consideran  una  condición  Lipschitz  de  la  forma: 


[x,y\F}-[y,z\F]W  <K\\x  -  z\\,  x,y,ze(l,  K>  0. 


(1.29) 


Es  fácil  ver  que  (1.29)  implica  (1.20),  puesto  que 

II  [x:y,F}-[u,v,F]  ||  <  ||  [x,y;  F\  —  [y,u;  F\  ||  +  ||  [y,  u;  F\  —  [u,  v\ F]  ||  <  K\\x-u\\+K\\y-v\\. 

Por  otro  lado,  tomando  x  —  z  en  (|1.29|),  se  sigue  [x,  y ;  F]  =  [y,  x\  F], 

Numerosos  ejemplos  importantes  de  diferencias  divididas  satisfacen  la  condición  (1.20), 
pero  no  cumplen  la  relación  simétrica  anterior  y,  en  consecuencia,  no  verifican  (1.29).  Notemos 
que  en  el  ejemplo  1.40,  Ai  y  A2  no  son  simétricas,  mientras  que  A3  y  \AX  +  | A2  si  que  lo 
son. 

Por  otra  parte,  Schmidt  m  y  Dennis  [[THj  prueban  la  convergencia  del  método  de  la 


secante  bajo  la  condición 

\\[x,y,F\  ~[y,z;F]\\  <  a\\x  -  z\\  +b(\\x-y\\  +  \\y  -  z\\) ,  a,b>  0.  (1.30) 


Además,  sustituyendo  la  condición  (1.20)  por  (1.30)  en  el  lema  1.43,  se  obtiene  la  misma 
conclusión  con  K  =  a  +  b, 


Para  operadores  F  cuya  derivada  F'  satisface  una  condición  Lipschitz  con  constante  C,  se 
sigue  fácilmente  la  siguiente  estimación  para  la  distancia  del  operador  a  su  parte  local  lineal 

||F(y)  -  F(x)  -  F'(x)(y  -  z)||  <  7||y  _  xf, 


(1.31) 
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sin  más  que  tener  en  cuenta 

F{x)  -  F(y )  -  F'(u)(x  -  y)  =  í  ( F'(y  +  t(x  -  y))  -  F'(u ))  dt{x  -  y). 

Jo 


(1.32) 


Notemos  que  si  utilizamos  una  diferencia  dividida  de  primer  orden  Lipschitz  continua  con 
constante  Ií ,  entonces  F'  es  Lipschitz  continua  con  constante  2 K  (lema  1.43)  y  (1.31)  tiene 
que  ser  reemplazada  por  una  de  las  estimaciones  que  aparecen  en  el  siguiente  resultado. 


Teorema  1.46.  Si  [x,y,F\  es  una  diferencia  dividida  de  primer  orden  que  satisface  (1.23), 
entonces  cada  una  de  las  siguientes  cuatro  expresiones 

ei  =  Ii  (||x  -  u||  +  || y  -  u\\  +  ||it  -  v\\)  ||x  -  y ||, 

e2  =  K  (||x  -  v\\  +  || y  -  u||  +  ||tt  -  v\\)  ||x  -  y ||, 

e3  =  K  (||x  -  y\\  +  || y  -  u||  +  || y  -  u||)  ||x  -  y ||, 

e4  =  K  (||x  —  y ||  +  ||x  —  «||  +  ||x  —  u||)  ||x  —  y ||, 


es  una  estimación  para 


||F(x)  -  F(y)  -  [u,v;F](x  -  y)||. 


DEMOSTRACIÓN.  Será  suficiente  dar  la  demostración  para  e\  y  e3  porque  la  demostración 
de  e2  se  obtiene  de  e\  intercambiando  uyvy,  de  forma  similar,  la  demostración  de  e4  se  puede 
obtener  considerando  x  en  lugar  de  y  en  los  lugares  apropiados.  Para  probar  e±,  obsérvese 
que  de  (1.32)  y 

||F'  ( y  +  t(x  -  y))  -  F\u) ||  <  2K(t\\x  -  u||  +  (1  -  t)\\y  -  n||) 

se  sigue 

\\F(x)-F(y)-F'(u)(x-y)\\  <  2K  (§||x  -  u||  +  \\\y  -  w||)  ||x  -  y\\ 

=  K(\\x -u\\  +  \\y -u\\)\\x -y\\. 

Además,  como 


| F\u)  —  [u,  v;  F]||  <  K\\u  —  u||, 


tenemos 


\\F(x)  -  F(y)  -  [u,v,F](x-y) ||  <  K  (||x-m||  +  \\y-u\\  +  \\u  -  v\\)  \\x  -  y\\ 
y  se  cumple  e\. 

Para  la  demostración  de  e3  consideramos 

\\F(x)-F(y)-[u,v;F\(x-y)\\  <  \\F(x)  —  F(y)  —  F’(y)(x  —  y)\\ 

+  11  (F'(y)  ~  W,v;F](u,v))  (x-y) || 

<  K\\x-y\\2  +  K(\\y-u\\  +  \\y-v\\)\\x-y\\.  ■ 

A  continuación,  generalizamos  la  condición  de  Lipschitz  continuidad  para  la  diferencia 
dividida  [x,y,F]  e  C(X,Y)  a  una  condición  de  Hólder  continuidad,  que  también  implica  la 
diferenciabilidad  del  operador  F. 
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Definición  1.47.  Sean  X  e  Y  dos  espacios  de  Banach,  F  :  í)  C  X  — y  Y,  un  subcon¬ 
junto  abierto  convexo  no  vacío  de  X  y  x  e  y  dos  puntos  distintos  de  Í2  que  tienen  asociada 
una  diferencia  dividida  de  primer  orden  [x,y,F]  es  ( K,p)-Hólder  continua  en  Í2  si  existen 
constantes  K  >  O  y  p  e  [0, 1]  tales  que 

II  [x,y,F\  -  [u,v;F]  ||  <  K  (||:r-w||p  +  \\y  -  v\\p );  Vx,y,u,v  eSl;  x^y,u^v.  (1.33) 


Observamos  que  si  p  =  1,  entonces  [x,y,F]  es  Lipschitz  continua  en  O. 


Ejemplo  1.48.  En  el  ejemplo  1.29  hemos  visto  que  el  operador  (1.12)  es  diferenciable  con 
derivada 

[F'{x o)  x](t)  =  - +  (/>'(x0 (t))  x{t). 


Si  utilizamos  (1.24),  se  sigue 


([x,y,F\  -  [u,v,F])  z(t)  =  í  (F'(y  +  r(x  —  y))  —  F'{v  +  t{u  —  v)) )  z(t)  dr 

Jo 

=  fo  +  t(x  -  2/))(t))  -  0'((u  +  t{u  -  v))(í)))  z(t)  dr. 


Suponiendo  ahora  que  <j>'  es  (O,  p)-H51der  continua  y  teniendo  en  cuenta  (1.25)  y 

\\{[x,y,F]  ~[u,v;F})  z\\  <  C  í  \\y  +  t(x  -  y)  -  (v  +  t(u  -  v))\\p  dr  \\z\ 

Jo 

—  C  í  \\r(x  —  u)  +  (1  —  r)(y  —  v)\\p  dt  \\z\\ 

Jo 


< 


C 


1  +p 


\x  —  u\\p  +  || y  —  u||p)  ||z||, 


se  sigue  que  la  diferencia  dividida  de  primer  orden  es  (Áhp)-Hblder  continua  en  C([a,  6])  con 


K  =  XY. 

i+p 


Además,  una  consecuencia  inmediata  de  (1.21)  y  (1.33)  es: 

II  [x,y\F]  -  F/(^)||  <  K  (||z  -  z\\p  +  || y  -  ^||p),  K  >  0,  p  e  [0, 1],  Vx,y,z  e  O.  (1.34) 

En  el  caso  (|1.34[)  es  conocido  que  la  derivada  Fréchet  F'  existe  en  O,  satisface  (1.21)  y  F' 
es  (2K,  p)-Hólder  continua  en  0,  ¡4j. 

Una  generalización  interesante  de  (1.30)  es  la  dada  por  Argyros  en  ¡4]  y  que  se  puede 
resumir  en  el  siguiente  resultado. 


Lema  1.49.  Sea  un  conjunto  abierto  convexo  no  vacío  de  X .  Suponemos  que,  para  todo 
x,  y  G  íl,  existe  una  diferencia  dividida  de  primer  orden  [x,y,F]  e  C{X,Y).  Si  z  G  Í2, 
entonces 

II [x,y,F\  -  [y,z;F] ||  <  a  \\x  -  z\\p  +  b  {\\x  -  y\\p  +  \\y  -  z\\p), 
donde  p  G  (0, 1]  y  a,  b  >  0.  Además, 

(i)  [x,x;  F]  =  F'{x),  x  G  int(íl), 


(1.35) 
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(ii)  || F'(x)  -  F'(y) ||  <  2 (a  +  6)||x  -  y\\p. 

Demostración.  Veamos  el  apartado  (i).  Elegimos  x  G  int(íl)  y  S  >  0  tales  que  B(x,  í)  C 
O.  Para  ||Ax||  <  S  se  tiene 


||F(x  +  Ax)  —  F(x)  —  [x,  x;  F]  (Ax)||  = 


< 

< 


||  [x  +  Ax,  x ;  F]  ( Ax)  —  [x,  x;  F]  ( Ax)  || 
||([x  +  A x,x;F]  — [x,x;F])  (Ax)|| 
||[x  + Ax,  x;F]  —  [x,  x;F]||  || A:r|| 

(«  +  b)  ||(Ax)f  ||  Ax||. 


Esta  desigualdad  prueba  (i)  cuando  a  +  b  /  0  y  ||  Ax||  — >  0,  ya  que 


||F(x  +  Ax)  —  F(x)  —  [x,  x]  F](Ax)|| 
||  Ax|[— >0  ||  Ax|| 


0. 


Para  solventar  el  caso  a  +  b  =  0,  notamos  que  a  =  b  =  0  y  por  (1.35)  existe  un  L  e  jC(X,  Y) 
tal  que  [x,y,  F]  =  L  para  cada  x,  y  G  ó.  Por  tanto,  por  (1.19),  podemos  elegir  5  arbitrario  y 
F'(x)  =  L. 

El  apartado  (ii)  se  sigue  de  (1.35)  y 


F'(x)  —  F'(y)\\  <  ||  [x,  x;  F]  —  [x,  y,  F]  ||  +  ||  [x,  y,  F]  —  [y,  y,  F]  || 

<  a  ||x  —  y\\p  +  b  ||x  —  y\\p  +  a  ||x  —  y\\p  +  b  ||x  —  y\\p 
=  2 (a  +  b)  ||x  —  y\\p, 


lo  que  completa  la  demostración.  ■ 


Todavía  podemos  generalizar  más  las  condiciones  de  Lipschitz  y  Hólder  continuidad  para 
la  diferencia  dividida  [x,y\F]  G  C(X,Y)  suavizando  ambas  condiciones  mediante  la  condi¬ 
ción: 


II[z,kF]  -  [tí,v;F]||  <  w(||i-u||,||!/-b||);  x,y,v,w  e  fi, 


(1.36) 


donde  u 


.xl 


-A 


es  una  función  continua  y  no  decreciente  en  sus  dos  componentes. 


En  el  siguiente  teorema  veremos  que  la  condición  (1.36)  implica  (1.21 )  cuando  u;(0, 0)  =  0, 


Teorema  1.50.  Sea  Í2  un  conjunto  abierto  convexo  no  vacío  de  un  espacio  de  Banach  X . 
Suponemos  que ,  para  cada  par  de  puntos  x,  y  G  Í2,  existe  una  diferencia  dividida  de  primer 


(1.21). 


orden  [x,y;F]  G  C(X,Y)  satisfaciendo  (1.36)  yu;(0,0)  =  0.  Entonces,  se  verifica  la  condición 


Demostración.  Sea  |xn}  c  ó  tal  que  líiri  xn  =  x.  Si  consideramos  An  =  fxn,  x;Fl  G 

n— >-o o 

C(X,  Y),  entonces 


1 1  An  Am ||  ||  [xn,  x,  F)  [xm,  x,  F ]  ||  A  ^ ( |  xn  xm  |  ,  0) . 


Como  {xn}  es  convergente,  se  tiene  que  {An}  es  una  sucesión  de  Cauchy  y,  por  tanto,  existe 
lím  An  —  A  G  C(X,Y)  y  podemos  definir  íx,  x;.Fl  —  A  —  lím  An.  Demostramos  entonces 

n— >oo  '  '  L  J  n— l-oo 
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que  A  =  F'(x): 

\\F(x  +  Ax)  —  F{x)  —  [x,  X]  F]  (Ax)||  =  ||[x  +  Ax,  x;  F]  (Ax)  —  [x,  x;  F](Ax) 

=  \\  ([x  +  Ax,x;F]  —  [x,x;F])  (Ax)|| 

<  \\[x  +  Ax,x]  F]  —  [x,x]  F]\\  ||Ax|| 

<  w(||Aa;||,0)||Aa;||. 


En  consecuencia, 

|| F(x  +  Ax )  —  F(x)  —  [ x ,  x ;  F](Ax) 


lím 

||  Ax||— >0 


l|Ax|| 


-  II  iT  n^dl^ll»0)  =  ^(0,0)  =  0. 
||  A®||— >0 


Es  fácil  ver  ahora  que  la  condición  (1.36)  generaliza  la  condición  (1.33),  sin  más  que 
considerar  íu(s,  t)  =  Ií(sp  +  tp). 

Por  otra  parte,  también  podemos  observar  que  si  F  no  es  diferenciable,  entonces  la  función 
uj  dada  en  (1.36)  es  tal  que  u;(0,  0)  >  0,  como  puede  verse  en  el  siguiente  ejemplo. 

Ejemplo  1.51.  Dado  el  siguiente  sistema  de  ecuaciones  no  lineales 

x2  —  y  +  1  +  ||x  —  1|  =  0, 

y2  +  x  -  7+  \\y\  =  0, 

lo  podemos  escribir  como  F(x)  =  0,  donde  x  =  (aq,  oq)  G  M2  y  F  :  M2  — >  M2  con  F  =  (E\,  F2) 

y 

Fi(xi,x2)  =  x2  -  x2  +  1  +  -\xi  -  1 1 ,  F2(xi,x2)  =  x2  +  xi  -  7+  -\x2\. 


9 


9' 


Tomando  x  =  (xi,x2)  G  M2  y  la  norma  ||x||  =  ||x||  =  máx  |x¿|,  la  norma  correspondiente 

l<i<2 


para  á  G  l2  x  K2  es 


PII  =  máx  El aó I- 


3= 1 


Ahora,  si  v,w  G  M2,  podemos  definir  [v,w,F]  G  £(M2,M2)  como, 

r  Fi(vi,  w2)  ->* Fi(wi,  w2)  r  ,  Fi(v1,v2)  -  Fi(v1,w2) 

[v,  w\  F\a  =  — - - - ,  [v,  w,  F \i2  =  — 


Vi  -  w  1 


v2  -  w2 


i  =  1,2. 


Entonces, 

[v,w,F\  = 


í  v\  —  w\ 

-1  1 

(  \vi 

-  1|  -  |u7i  -  1| 

0 

\ 

V\  -  Wi 

1 

+  9 

Vi  -  VJi 

1 

V2  -  W2 

0 

\v2 1  -  \w2\ 

v2  -w2  ) 

{ 

v2  -  w2 

/ 

2 

II [x,y,F\  -  [v,w,F\\\  <  ||a:  —  u||  +  \\y  -  w\\  +  -, 

2 

de  manera  que  oj(s,t)  =  s  +  t  +  -  y  u;(0,  0)  >  0.  Observamos  que  esta  situación  surge  del 

9 

hecho  de  que  la  función  F  sea  no  diferenciable. 
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1.5.  Métodos  iterativos  en  espacios  de  Banach 


Dado  un  operador  F  :  Í2  C  X  — y  Y  definido  en  un  dominio  abierto  convexo  no  vacío 
0  contenido  en  un  espacio  de  Banach  X  y  con  valores  en  un  espacio  de  Banach  Y,  nos 
planteamos  la  aproximación  de  una  solución  x*  de  la  ecuación 


F(x)  =  0. 


(1.37) 


En  estas  condiciones  tan  generales,  la  ecuación  (1.37)  puede  representar  una  ecuación  escalar, 


un  sistema  de  ecuaciones,  una  ecuación  diferencial,  una  ecuación  integral,  etc. 


Encontrar  una  solución  exacta  de  ( 1.37)  suele  ser  difícil  y,  por  eso,  se  recurre  habitualmente 


a  su  aproximación  mediante  métodos  iterativos  de  la  forma 

í  dados  X-k,X-k+i,  •  •  • ,  £-i,  x0  en  fl, 

\  *£n+ 1  G(xn—kj  Xn-k-^i ,  •  •  •  ,  Xn_i,  n  A  0, 


(1.38) 


donde  X-k,  X-k+i, . . . ,  x_i,  xq  son  aproximaciones  iniciales  de  x*.  Los  métodos  iterativos  ( 1.38 ) 


con  k  =  0  se  llaman  métodos  iterativos  punto  a  punto  (sin  memoria)  y  si  k  >  1,  se  llaman 
métodos  iterativos  con  memoria. 


Un  método  iterativo  de  la  forma  (1.38)  persigue  que,  a  partir  de  las  aproximaciones 
iniciales  X-k,  X-k+i, . . . ,  x_i,  Xo,  la  sucesión  de  valores  que  define,  {xn},  sea  tal  que  los  valores 
xn  sean  mejores  aproximaciones  de  x*  a  medida  que  n  crece  y  que  además  límn  xn  =  x*.  Esto 
es  lo  que  llamamos  convergencia  del  método  iterativo. 

A  la  hora  de  estudiar  la  convergencia  de  un  método  iterativo,  existen  tres  tipos  de  resul¬ 
tados  de  convergencia:  locales,  semilocales  y  globales.  En  primer  lugar,  los  resultados  de  con¬ 
vergencia  local,  que,  a  partir  de  determinadas  condiciones  que  tiene  que  cumplir  el  operador 
F  y  exigiendo  condiciones  a  la  solución  x* ,  proporcionan  la  denominada  bola  de  convergencia 
del  método  iterativo,  que  nos  indica  la  accesibilidad  de  x*  a  partir  de  aproximaciones  ini¬ 
ciales  consideradas  en  dicha  bola.  En  segundo  lugar,  tenemos  los  resultados  de  convergencia 
semilocal,  que,  a  partir  de  determinadas  condiciones  que  tiene  que  cumplir  el  operador  F  y 
exigiendo  condiciones  a  las  aproximaciones  iniciales  X-k,X-k+h  ■  ■  ■  ,x_i,x0,  proporcionan  el 
dominio  de  parámetros  asociado  a  las  condiciones  que  deben  satisfacer  las  aproximaciones 
iniciales  para  tener  asegurada  la  convergencia  de  la  sucesión  {xn}  a  x*.  Por  último,  tenemos 
los  resultados  de  convergencia  global,  que,  a  partir  de  determinadas  condiciones  que  tiene 
que  cumplir  el  operador  F,  e  independientemente  de  las  aproximaciones  iniciales,  aseguran 
la  convergencia  de  la  sucesión  {xn}  a  x*. 

Como  vemos,  todos  los  resultados  anteriores  pasan  por  exigir  determinadas  condiciones 
al  operador  F.  Sin  embargo,  la  exigencia  de  condiciones  para  la  solución,  para  las  aproxi¬ 
maciones  iniciales,  o  para  ninguna  de  éstas,  determinan  los  diferentes  tipos  de  resultados  de 
convergencia.  Por  un  lado,  el  estudio  de  la  convergencia  local  tiene  el  inconveniente  de  te¬ 
ner  que  asegurar  que  la  solución  x*,  que  desconocemos,  satisfaga  determinadas  condiciones. 
Por  otro  lado,  la  ausencia  de  condiciones  para  las  aproximaciones  iniciales,  e  incluso  para 
la  solución  x*,  hace  que  el  estudio  de  la  convergencia  global  sea,  en  general,  excesivamente 
particular  en  cuanto  al  tipo  de  operadores  a  tratar. 


Por  otra  parte,  cuando  estudiamos  la  aplicabilidad  de  un  método  iterativo  (1.38)  para 


resolver  (1.37),  aparece  un  problema  importante:  la  localización  de  aproximaciones  inicia¬ 


les  x_fc,x_fc+i, . . .  ,x_i,Xq  suficientemente  buenas  como  para  que  la  sucesión  {xn},  dada  por 
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(1.38),  converja  a  una  solución  empezando  en  ellas.  El  conjunto  de  estas  aproximaciones  ini¬ 


ciales  es  lo  que  permite  medir  la  accesibilidad  del  método  iterativo  (1.38).  Podemos  observar 


la  accesibilidad  del  método  (1.38)  de  forma  experimental,  mediante  cuencas  de  atracción  y  re¬ 


giones  de  accesibilidad,  al  considerar  ecuaciones  particulares,  y/o  de  forma  teórica,  mediante 
dominios  de  parámetros,  para  cualquier  ecuación. 

La  cuenca  de  atracción  es  el  conjunto  de  todos  los  puntos  de  salida  a  partir  de  los  cuales  el 


método  iterativo  (1.38)  converge  a  una  solución  de  una  ecuación  particular  una  vez  fijada  una 


tolerancia  o  un  número  máximo  de  iteraciones.  La  región  de  accesibilidad  permite  visualizar, 
a  partir  de  condiciones  de  convergencia,  qué  puntos  podemos  utilizar  como  puntos  de  salida 
para  que  el  método  iterativo  converja,  empezando  en  ellos,  a  una  solución  de  una  ecuación 
particular.  Y  el  dominio  de  parámetros  establece  gráficamente,  en  el  plano  real,  la  relación 
entre  los  parámetros  iniciales  que  se  definen  a  partir  de  las  condiciones  impuestas  a  los  puntos 
de  salida  en  un  resultado  teórico  de  convergencia. 

En  este  texto  vamos  a  hacer  hincapié  solo  en  el  estudio  de  la  convergencia  semilocal  de 
los  métodos  iterativos  que  aparecen  en  él,  pero  realizándolo  mediante  diferentes  técnicas  de 
demostración  y  viendo  qué  es  lo  que  aporta  cada  una  de  ellas  en  el  estudio  de  los  métodos 
iterativos  aquí  presentados. 

También  sabemos  que  las  propiedades  de  convergencia  dependen  de  la  elección  de  la 
distancia  ||  •  ||,  pero  la  velocidad  de  convergencia  de  una  sucesión  {xn},  para  una  distancia 
dada,  se  caracteriza  por  la  velocidad  de  convergencia  de  la  sucesión  de  números  no  negativos 
{||xn  —  x*||},  donde  x*  =  lím  xn.  Una  medida  muy  utilizada  habitualmente  de  la  velocidad 

n— >-+oo 

de  convergencia  es  el  /¿-orden  de  convergencia,  que  definimos  a  continuación. 

Definición  1.52.  Sean  {xn}  una  sucesión  en  un  espacio  de  Banach  X  que  converge  a  un 
punto  x*  G  X,  un  número  r  >  1  y 


en  r  = 


n  si  t  =  1, 
Tn  si  T  >  1, 


n  >  0. 


i)  Decimos  que  r  es  un  R-orden  de  convergencia  de  la  sucesión  {xn}  si  existen  dos  cons¬ 
tantes  b  G  (0, 1)  y  B  G  (0,  +oo)  tales  que 


\xr 


-x*\\  <  Bbe^r). 


n)  Decimos  que  r  es  el  R-orden  de  convergencia  de  la  sucesión  {xn}  si  existen  constantes 
a,b  G  (0, 1)  y  A,  B  G  (0,  +oo)  tales  que 


/men(r) 


En  general,  comprobar  la  doble  acotación  de  ii )  es  complicado,  por  eso  normalmente  solo 
se  buscan  acotaciones  superiores  como  las  de  i).  Por  tanto,  si  encontramos  un  /¿-orden  de 
convergencia  r  de  la  sucesión  {xn},  entonces  se  dice  que  la  sucesión  {xn}  tiene  /¿-orden  de 
convergencia  al  menos  r.  Este  es  el  argumento  utilizado  habitualmente  para  estudiar  el  orden 
de  convergencia  de  un  método  iterativo  en  espacios  de  Banach. 

A  continuación,  vamos  a  focalizar  todo  lo  que  acabamos  de  describir  para  un  método 
iterativo  concreto,  el  método  de  Newton,  con  el  objetivo  de  mejorar  su  entendimiento. 
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1.5.1.  Convergencia  semilocal  del  método  de  Newton 


De  entre  los  métodos  iterativos  de  la  forma  (1.38),  que  se  pueden  utilizar  para  aproximar 
una  solución  x*  de  la  ecuación  (1.37),  el  más  conocido  de  todos  ellos  es,  sin  lugar  a  dudas, 
el  método  de  Newton,  que  destaca  por  su  sencillez,  fácil  aplicación  y  eficiencia.  Este  método 
tiene  el  siguiente  algoritmo: 


í  dado  x0  en  O, 

\  xn+1  =  xn  -  [F'(xn)]~1F(xn),  n>  0. 

El  primer  resultado  de  convergencia  semilocal  para  el  método  de  Newton  en  espacios  de 
Banach  fue  dado  por  Kantorovich  [27],  se  conoce  universalmente  como  teorema  de  Newton- 
Kantorovich  y  se  demuestra,  bajo  las  condiciones  que  se  exigen  a  continuación  al  operador  F 
y  al  punto  inicial  x0,  mediante  el  conocido  principio  de  la  mayorante. 

En  primer  lugar,  suponemos  que  se  satisfacen  las  siguientes  tres  condiciones: 

(Al)  ||F(x0)||<¿, 

(A2)  existe  el  operador  [F^xo)]-1  G  C(X,  Y),  para  algún  xq  6  íl,  y  es  tal  que 
||[F/(x0)]-1||  <  9, 

(A3)  ||F'(x)  —  F'(y)\\  <  C\\x  —  y\\,  C  >  0,  x,y  G  íí. 

En  segundo  lugar,  definimos  el  polinomio  cuadrático 

P(t)  =  ^  +  S,  t  G  [0,  t'], 

tal  que  t*  <  t**  <  t',  donde  t*  =  es  la  raíz  positiva  más  pequeña  del  polinomio  p 

y  t**  =  1+^1cqC5—  es  la  raíz  positiva  más  grande,  y  la  sucesión  escalar  {fn}  dada  por 

í  ¿0  =  0, 

{  .  P(tn)  .  n 

[  n+1  71  P'(tny  71  -0' 

Observemos  que  la  sucesión  {fn}  converge  de  forma  creciente  a  £*,  sin  más  que  tener  en 
cuenta  que  es  una  sucesión  monótona  no  decreciente  y  está  acotada  superiormente  por  t*. 

Teorema  1.53.  (Teorema  de  Newton-Kantorovich)  Sea  F  :  fl  C  X  — >•  Y  un  operador  una 
vez  continuamente  diferenciable  Fréchet,  definido  en  un  dominio  abierto  convexo  no  vacío 
O  de  un  espacio  de  Banach  X  y  con  valores  en  un  espacio  de  Banach  Y.  Supongamos  que 
se  verifican  las  condiciones  (A1)-(A3),  C592  <  \  y  B(xo,t*)  C  0,  donde  t*  =  . 

Entonces,  la  ecuación  F(x)  =  0  tiene  una  solución  x*  y  el  método  de  Newton  converge  a  x* 
empezando  en  x0.  Además,  xn,x*  G  B(x0,t*),  para  todo  n  G  N.  Por  otra  parte,  si  C592  < 
x*  es  la  única  solución  de  F(x )  =  0  en  B(x0,t**)  fl  O,  donde  t**  =  Í+^1~2C56~. 

DEMOSTRACIÓN.  En  primer  lugar,  x±  está  bien  definido,  puesto  que,  por  hipótesis,  existe 
[F^xo)]-1.  Además, 

Iki  -loll  =  ||[F'(x„r1F(i„)||  <  ||[F'(x„r1||||F(x„)||  <  -Nf  =íi-ío  <  í* 

P  v-o) 
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y,  en  consecuencia,  x\  G  B(xo,t*). 

A  continuación,  veamos  que  X2  está  bien  definido.  Para  ello,  tenemos 

||/-[F(o;o)]-1F'(a;1)||  <  || [^(aro)]-1» \\F'(x0)  -  F'(Xl)\\ 

<  C,||[F,(x0)]_1||||a;i-xo|| 

C 


< 


P'(t 0) 

1 


=  1  - 


<  1, 


P'(to) 
P'{t  1 


(ti  —  to) 

(p'(t l)  -  p'(t0 )) 


P'(t0) 


porserp'^)  >  Oyp'(íi)  >  p'(t0).  Luego,  por  el  lema  de  Banach  (lema  1.22),  existe  [-F'(xi)]  1 

y 


Por  tanto,  x2  está  bien  definido. 
Por  otra  parte,  como 


F(x  1)  =  F(xq)  +  F\x 0)(xi  -  x0)  +  /  (. F\z )  -  F\x0))  dz 

JXQ 


rx  1 


\F\z)-F'{xo))dz 


'XQ 


y 


=  /  (F\x o  +  t(x  1  -  x0))  -  F'^o))  dr(xi  -  x0) 

Jo 

||A(xi)||  <  f  \\F'(x0  +  t(xi  -  x0))||  dr\\xi  -  x0|| 

Jo 

<C  t\\xi  -  x0||  dr\\xi  -  x0|| 

2o 

<  CÍ  r(íi  -  í0)(íi  -  t0)  dr 
Jo 

=  I  (p'(t0  +  T(ti  -tQ))  -pito))  (ti  -t0)dr 

Jo 


'to 


(. p'(s )  -  //(to))  ds 

=  p(ti)  -  p(ío)  -  //(to)  (ti  -  t0) 
=  P(ti), 


entonces 


11^2 -a:i||  =  ||[A,(a:1)]  ^(x^ll  <  ||[F'(x1)]  1||||F(a;1)||  <  =  í2  “  ti, 

P  VlJ 
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|| £2  —  ®o||  <  \\%2  —  aq||  +  ||xi  -  x0||  <  t2  -  ti  +  ¿i  -  t0  =  t2  -  t0  <  t* . 
y,  en  consecuencia,  íc2  G  B(xo,t*). 

Procediendo  ahora  por  inducción  sobre  n,  se  prueba  fácilmente  que  la  sucesión  {xn}  está 
bien  definida,  xn  G  B(x0,t*),  para  todo  n  >  0,  y 

||xn+i  -xn\\  =  ||[F'(a;ri)]_1F(a;n)||  <  ||[F/(xn)]“1||||F(a;n)||  <  =  tn+i  —  tn, 

P  V'n) 

H-^n+l  Xo||  ^  H^n+l  *£n||  4“  1 1 Xn  íCoH  tnjr\  tn  T  tn  ¿o  tn+1  ^0  ^  t  . 

Como  lím  tn  =  t*.  entonces  existe  x*  tal  que  x*  =  lím  xn.  Veamos  que  x*  es  solución  de 

n— >■  oo  n— >■  oo 

F(x)  —  0.  De  llF'^n)  —  -F'(:eo)||  <  C\\xn  —  x0||  <  Ct*,  se  sigue  ||F,(xn)||  <  F'(x0)  +Ct*,  para 
todo  n  >  0.  Entonces,  como  F(xn)  =  F'(xn)(xn+ 1  —  xn),  pasando  al  límite  cuando  n  — >  oo 
y  teniendo  en  cuenta  que  la  sucesión  {||F'(a;n)||}  está  acotada,  obtenemos  F(x*)  =  0  por  la 
continuidad  de  F. 

Finalmente,  probamos  la  unicidad  de  solución.  Suponemos  que  existe  otra  solución  y*  G 
B(x0,t**)  fl  Í2  de  la  ecuación  F(x)  =  0  distinta  de  x*.  Consideramos 


F(y*)  -  F(x*)  =  íy  F\x)  dx  =  ['  F\x*  +  t(y*  -  x*))(y*  -  x*)  dt  =  0 
Jx*  j  0 

y  el  operador  J  —  f  F'(x*  +  t(z*  —  x*))  dt.  Como 
Jo 


I  -  [F'Oro)]-1  J||  < 
< 
< 
< 


||[F'(xo)]-1||||F'(x0)-  J|| 

II  1|  ||  / 1  \\F'(x*  +  t(y*  -  x *))  -  F'(x0)\\  dt 

Jo 

ce  f  ((1  -  t)\\x*  -  x0||  +  t(\\y*  -  Xoll))  dt 
Jo 

ce, 

i, 


(1.39) 


el  operador  J  es  inversible,  por  el  lema  de  Banach  (lema  1.22),  y,  por  tanto,  x*  =  y* 


Técnicas  alternativas  al  principio  de  la  mayorante  para  demostrar  la  convergencia  semilo- 
cal  de  los  métodos  iterativos  en  espacios  de  Banach  están  basadas  en  relaciones  de  recurrencia. 
Desde  que  Kantorovich  generalizó,  a  mediados  del  siglo  XX,  el  método  de  Newton  a  espacios 
de  Banach,  varios  autores  han  demostrado  la  convergencia  semilocal  del  método  de  Newton 
mediante  este  tipo  de  técnicas,  incluido  el  propio  Kantorovich,  cuyas  primeras  demostracio¬ 
nes  están  basadas  en  relaciones  de  recurrencia.  Nosotros  presentamos,  a  continuación,  una 
técnica  de  este  tipo,  desarrollada  por  los  autores  del  texto  EDI.  que  da  muy  buenos  resultados 
y  que  es  muy  sencilla  de  utilizar. 

En  primer  lugar,  definimos  la  sucesión  de  números  reales 

a0  =  Cóe2,  an  =  /(an_ i)2,  n  G  N,  donde  f(t)  =  . 

Notemos  que  consideraremos  ao  >  0,  puesto  que  si  ao  =  0,  queda  un  problema  trivial  por 
ser  xq  la  solución  de  una  ecuación  F(x)  =  0. 
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A  continuación,  mediante  inducción  matemática  sobre  n,  se  prueban,  para  n  >  1,  las 
siguientes  dos  relaciones  de  recurrencia  entre  la  sucesión  escalar  {an}  y  la  dada  por  el  método 
de  Newton,  {a:n},  en  el  espacio  de  Banach  X: 

(■ in )  El  operador  [F'(xn)]_1  existe  y  es  tal  que  || [^'(a:^)] _1 1|  <  /(an_i)|| [F/(xn_i)]“1||, 

(iin)  ||xn+i  -  xn\\  <  f  (an-i)\\xn  -  Xn_i||. 

Veamos  que  las  dos  relaciones  de  recurrencia  anteriores  se  cumplen  para  n  —  1.  Supo¬ 
niendo  que  ao  <  1  y  x\  G  Í2,  se  sigue 


I  -  [F/(x0)]-1F'(a;1)||  <  ||  [^(^o)]”1  II  \\F'(x0)  -  <  C0\\Xl  -  x0||  <  C862  =  a0  <  1. 


Entonces,  por  el  lema  de  Banach  (lema  1.22),  el  operador  [F'(xi)]  1  existe  y  es  tal  que 

ll[E>o)]-1|| 


ii[n*ar1ii< 


|J—  [F/(xo)]_1F/(a;1)|| 


<f(a0)\\[F'(x0)] 


-ii 


Por  tanto,  tenemos  (¿i). 


Ahora,  utilizando  la  fórmula  de  Taylor  (teorema  1.38) 


F(Xl)  =  f  (F'(x0  +  r(x i  -  x0))  -  F'(x 0))  dr(x i  -  x0) 
Jo 


y  (A3),  obtenemos 

Cn  ll2  CS6 

||A(a;i)||  <  — ||xi  -  x0|r  <  ~^\\x^  ~  xo||- 

Además, 

||a?2  —  a?i||  =  ||[F/(xi)]-1F(xi)||  <  ||  [F/(xi)]"1||  ||F(xi) ||  <  y/(a0)||xi  -  x0||. 

Por  tanto,  tenemos  (iii). 

Si  suponemos  ahora  que  an  <  1  y  xn  G  Í2,  para  todo  n  G  N,  y  que  las  relaciones  (ik)~ 
(' iik )  se  verifican  para  k  =  1,2,  ...,n,  las  relaciones  (in+i)-(ün+ 1)  se  demuestran  de  forma 
totalmente  análoga  a  las  relaciones  (¿i)-(üi)  y  se  completa  la  inducción. 

En  segundo  lugar,  para  probar  la  convergencia  de  la  sucesión  {xn}  definida  por  el  método 
de  Newton  en  el  espacio  de  Banach  X,  debemos  probar  que  {xn}  es  una  sucesión  de  Cauchy 
contenida  en  Í2  y  que  an  <  1,  para  todo  n  >  0 .  Para  ello,  comenzamos  dando  algunas 
propiedades  de  la  sucesión  escalar  {an}  en  el  siguiente  lema. 

Lema  1.54.  Si  ao  <  entonces 
0')  A  =  y/(ao)2  <  1, 

(n)  la  sucesión  {an}  es  estrictamente  decreciente, 

(ni)  an  <  1,  para  todo  n>  0. 

Si  a0  =  entonces  an  —  a0<  1,  para  todo  n  G  N. 
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DEMOSTRACIÓN.  En  primer  lugar,  consideramos  el  caso  ao  <  El  apartado  (i)  es  in¬ 
mediato.  En  cuanto  a  (ii),  lo  demostramos  por  inducción  matemática  sobre  n.  Como  A  <  1, 
entonces  ai  <  ao-  Suponemos  ahora  que  a¡,  <  dk-i  para  k  —  1,  2, . . . ,  n.  Luego, 

a2 

dn+i  g  f  ^  ÍA  an  <1  an, 

por  ser  /  creciente.  Por  tanto,  la  sucesión  {an}  es  estrictamente  decreciente. 

Para  ver  (ni),  tenemos  que  an  <  a0  <  1,  para  todo  n  >  0,  por  ser  {an}  una  sucesión 
estrictamente  decreciente  y  a0  <  \- 

Si,  por  otra  parte,  a0  =  |,  entonces  A  =  -^/(ao)2  =  1  y,  en  consecuencia,  tenemos 
an  =  do  =  \  <  1,  para  todo  n  >  0.  ■ 


A  continuación,  probamos  el  teorema  de  convergencia  semilocal. 


Teorema  1.55.  Sea  F  :  ó  C  X  — >•  Y  un  operador  una  vez  continuamente  diferenciable 
Fréchet,  definido  en  un  dominio  abierto  convexo  no  vacío  ó  de  un  espacio  de  Banach  X  y 
con  valores  en  un  espacio  de  Banach  Y.  Supongamos  que  se  verifican  las  condiciones  (Al)- 
(AS),  a0  =  C592  <  2  y  B(x0,p)  C  ó,  donde  p  =  Entonces,  la  ecuación  F(x )  =  0 

tiene  una  solución  x*  y  el  método  de  Newton  converge  a  x*  empezando  en  xo.  Además, 
xn,  x*  G  B(xo,  p),  para  todo  n  G  N,  y  la  solución  x*  es  única  en  la  región  B  (xo,  D  ó. 

Demostración.  Sabemos  por  el  lema  anterior  que  an  <  1  para  todo  n  >  0.  Veamos  que 
{xn}  es  una  sucesión  de  Cauchy  y  que  xn  G  B(xo,p),  para  todo  n  >  1.  Así,  para  m  >  1  y 
n  >  1,  vemos 


||^'n+m  Xn\\  —  ||  *£71+771  1||  ~L  ||xn_|_m_i  Xn_|_m_2||  T  "  "  "  T  ||xn_|_i  Xr¡ 

<  (i+T2(ri|/w))iK+.-»ii. 


(1.40) 


Como  {a,j}  es  estrictamente  decreciente  y  /  es  creciente,  por  el  lema  anterior  y  (1.40),  para 
n  >  1,  tenemos 


nfi-m— 2 


iix„+m-xn|i  <  i  n  i  ii®i  -  ®oi 

i=n- 1  \j= 0  ¿ 


n+m—2  ,  v  i+ 1 

E  (f/M 


i—n—  1 
m—  1 


[Xi  -  Xo 


Bi—1  ,  \  i-\-n 

\xf(a o))  Iki-^oll 
i= o  v  z  7 

1  -  Am 

An  1- A  HXl  ~X°H- 


Luego,  la  sucesión  { xn }  es  de  Cauchy  por  ser  A  =  ~^f(a o)2  <  1- 


Si  ahora  hacemos  n  —  0  en  (1.40),  entonces 

1  —  Am ,, 


\Xm  Xq 


\Xl  -  Xo  < 


59 


1  -  A 


=  P- 


1  -  A 
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Por  lo  tanto,  xn  G  B(xo,p),  para  todo  n  6  N,  la  sucesión  {xn}  está  bien  definida  y  es 
una  sucesión  de  Cauchy.  Luego,  lím  xn  =  x*  G  B(xq,p).  Veamos  que  x*  es  una  solución  de 

n— ^oo 

F(x)  =  0.  Como  ||  [F'(;rn)]~1F(;cn)||  =  ||a;n+i  —  xn||  — >  0  cuando  n  — >  oo,  teniendo  en  cuenta 

||F(^)||<||F'(xn)||||[F'(xn)]-1F(xn)|| 

y  que  la  sucesión  {||F/(:rn)||}  está  acotada,  puesto  que 

(A3) 

im*n)||  <  llF'^o)!!  +  C\\xn  -  x0||  <  ||F,(xo)||  +  Cp, 


se  sigue  ||F(xn)||  — »  0  cuando  n  — >  ex).  En  consecuencia,  obtenemos  F(x*)  =  0  por  la 
continuidad  de  F  en  B(x0,p). 

Para  probar  la  unicidad,  suponemos  que  y*  es  otra  solución  de  F(x)  =  0,  distinta  de  x*, 
en  la  región  B  [xq,  fifi.  Entonces,  a  partir  de  la  aproximación  (1.39),  tenemos  que  probar 

que  el  operador  J  —  ¡  F'(x*  +  t(y*  —  x*))  dt  es  inversible.  En  efecto, 

Jo 


como 


|/ -  [F'(xo)]-1  J||  < 

<  ||[F'(a;o)]-1||||  i"  \\F\x*  +  t(y*  -  x*))  -  F'(a;o)||  dt 

Jo 

<  C6  f  ((1  -  t)\\x*  -  x0\\  +  t(\\y*  -  x0\\))  dt 

Jo 


10 

ce  ,  ,  ,  A 

<  2  v  +  ce) 

=  1, 


por  el  lema  de  Banach  (lema  1.22),  el  operador  J  es  inversible. 


Terminamos  esta  sección  recordando  que,  utilizando  la  definición  1.52  de  P-orden  de 
convergencia,  es  conocido  que  el  método  de  Newton  tiene  P-orden  de  convergencia  al  menos 
dos 


1.5.2.  Accesibilidad  del  método  de  Newton 


Tal  y  como  liemos  indicado  anteriormente,  podemos  observar  la  accesibilidad  de  un  mé¬ 
todo  iterativo  desde  tres  puntos  de  vista,  dos  de  los  cuales,  la  cuenca  de  atracción  y  la  región 
de  accesibilidad,  son  experimentales,  y  el  otro,  el  dominio  de  parámetros,  es  teórico.  Tanto 
la  cuenca  de  atracción  como  la  región  de  accesibilidad  están  asociadas  a  la  ecuación  a  resol¬ 
ver,  mientras  que  el  dominio  de  parámetros  no,  ya  que  éste  está  asociado  a  un  resultado  de 
convergencia  semilocal. 

Para  un  sencillo  entendimiento  de  estas  tres  formas  de  observar  la  accesibilidad  de  un 
método  iterativo  cuando  se  aplica  a  la  resolución  de  una  ecuación,  vamos  a  utilizar  el  método 
de  Newton  y  la  ecuación  compleja  académica  F(z)  =  z3  —  1  =  0,  donde  F  :  C  — »  C. 
Notemos  que  la  ecuación  anterior  tiene  tres  raíces  complejas:  z*  —  1,  z**  =  expí^1)  y 
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Cuenca  de  atracción 


Recordamos  que  la  cuenca  de  atracción  es  el  conjunto  de  todos  los  puntos  de  salida  a 
partir  de  los  cuales  un  método  iterativo  converge  a  una  solución  una  vez  fijada  una  tolerancia 
o  un  número  máximo  de  iteraciones.  En  la  figura  1.3  mostramos  las  cuencas  de  atracción 
asociadas  a  las  tres  raíces  de  la  ecuación  anterior  cuando  aplicamos  el  método  de  Newton  para 
su  aproximación.  Para  representar  las  cuencas  de  atracción  hemos  considerado  un  rectángulo 
D  en  el  plano  complejo  C  y  asignado  un  color  para  cada  raíz  a  la  cual  el  método  de  Newton 
converge. 


Figura  1.3:  Cuencas  de  atracción  de  las  tres  raíces  de  z3  —  1  =  0  cuando  se  aproximan 
mediante  el  método  de  Newton. 

En  la  práctica,  consideramos  una  malla  de  512  x  512  puntos  en  D  y  elegimos  estos  puntos 
como  Xq .  Utilizamos  el  rectángulo  [—2.5, 2.5]  x  [—2.5, 2.5]  que  contiene  a  las  tres  raíces.  El 
método  de  Newton,  empezando  en  un  punto  Xq  G  D ,  puede  converger  a  cualquiera  de  las 
tres  raíces  o,  eventualmente,  diverger.  En  todos  los  casos,  utilizamos  la  tolerancia  1CU3  y 
un  máximo  de  50  iteraciones.  Si  no  obtenemos  la  tolerancia  deseada  con  50  iteraciones,  no 
se  continúa  y  decidimos  que  el  método  iterativo  no  converge  a  ninguna  raíz  comenzando 
en  zq-  En  particular,  liemos  utilizado  respectivamente  los  colores  cyan,  magenta  y  amarillo 
para  las  cuencas  de  atracción  de  las  raíces  z*,  z**  y  z***,  respectivamente.  El  color  se  hace 
más  claro  o  más  oscuro  según  sea  el  número  de  iteraciones  utilizadas  para  alcanzar  una 
raíz  con  la  precisión  fijada.  No  hemos  pintado  los  puntos  del  rectángulo  correspondientes  a 
las  aproximaciones  iniciales  a  partir  de  las  cuales  no  se  alcanza  ninguna  de  las  raíces  con 
tolerancia  1CU3  en  un  máximo  de  50  iteraciones.  Para  otras  estrategias  se  puede  consultar 
y  las  referencias  allí  dadas.  Los  gráficos  se  han  generado  con  Mathematica  5.1  H. 

Región  de  accesibilidad 

Sabemos  que  los  puntos  de  salida  del  método  de  Newton  tienen  asociados  los  parámetros 
ó,  6  y  C  dados  en  las  condiciones  iniciales  (Al)-(A3).  Para  representar  las  regiones  de  acce- 
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sibilidad  del  método  de  Newton,  coloreamos  los  puntos  cuyos  parámetros  asociados  verifican 
las  condiciones  de  convergencia  y,  en  otro  caso,  no  los  coloreamos.  La  región  de  accesibilidad 
asociada  a  una  solución  de  una  ecuación  nos  indica  entonces  el  dominio  de  puntos  de  salida 
a  partir  de  los  cuales  tenemos  asegurada  la  convergencia  del  método  de  Newton  (es  decir,  el 
conjunto  de  puntos  de  salida  que  satisfacen  las  condiciones  de  convergencia  para  el  método 
de  Newton). 

A  continuación,  en  la  figura  1.4,  vemos  cuáles  son  las  regiones  de  accesibilidad  asociadas 
a  las  raíces  de  la  ecuación  z3  —  1  =  0  cuando  se  aproximan  mediante  el  método  de  Newton. 
Representamos  la  regiones  de  accesibilidad  coloreando  los  puntos  x0  que  verifican  la  condición 
CÓO2 


<  |  del  teorema 


1.53 


Hemos  utilizado  los  colores  cyan,  magenta  y  amarillo  para  regiones  de  accesibilidad  de  las 
raíces  z*,  z**  y  z***,  respectivamente.  Y,  al  igual  que  para  las  cuencas  de  atracción,  el  color 
se  hace  más  claro  o  más  oscuro  según  sea  el  número  de  iteraciones  utilizadas  para  alcanzar 
una  solución  con  la  precisión  fijada.  Los  gráficos  se  han  generado  de  nuevo  con  Mathematica 
5.1 


Figura  1.4:  Regiones  de  accesibilidad  de  las  tres  raíces  de  la  ecuación  z3  —  1  =  0  para  el 
método  de  Newton  según  el  teorema  de  Newton-Kantorovich  (teorema  1.53). 


Dominio  de  parámetros 


Aparte  de  la  observación  empírica  de  la  accesibilidad  del  método  de  Newton  dado  por 
las  cuencas  de  atracción  y  las  regiones  de  accesibilidad,  podemos  realizar  un  estudio  de  la 
accesibilidad  de  dicho  método  a  partir  de  las  condiciones  de  convergencia  impuestas  en  el 


teorema  de  convergencia  semilocal  1.53 


Observamos  que  las  condiciones  de  convergencia  impuestas  en  el  teorema  1.53  tienen  dos 


partes  diferenciadas.  Por  una  parte,  las  condiciones  iniciales  (Al)-(A2)  exigidas  al  punto  de 
salida  Xoj  y  por  otra,  la  condición  (A3)  exigida  al  operador  F.  Para  estudiar  las  restricciones 
que  se  imponen  con  las  condiciones  iniciales,  utilizamos  el  dominio  de  parámetros,  que  esta- 
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blece  gráficamente  en  un  plano  real  la  relación  entre  los  parámetros  que  se  definen  a  partir 
de  las  condiciones  iniciales. 


A  partir  del  teorema  1.53  si  queremos  estudiar  teóricamente  la  accesibilidad  del  método 
de  Newton,  basta  con  tener  en  cuenta  que,  dado  x0  G  fl,  el  método  tiene  asociados  los 
parámetros  5  y  9  que  aparecen  en  (Al)  y  (A2).  Así,  a  partir  de  la  condición  de  convergencia 
C592  <  \  del  teorema  1.53,  podemos  definir  el  dominio  de  parámetros  asociado  a  dicho 
teorema  como  el  conjunto  del  plano  real  dado  por  {(5,0)  G  M2  :  CS92  <  Por  un  lado, 
observamos  que  el  parámetro  S  mide  la  aproximación  de  Xo  a  la  solución  x*.  Notemos  entonces 
que  ó  =  0  si  x0  =  x*.  Por  otro  lado,  observamos  que  el  parámetro  C,  que  se  define  a  partir 
de  la  condición  (A3)  que  se  exige  al  operador  F,  es  siempre  una  cantidad  fija,  de  manera  que 
no  va  a  influir  en  el  dominio  de  parámetros. 

En  la  figura  L5  mostramos  el  dominio  de  parámetros  del  método  de  Newton  asociado  al 
teorema  fiH  Para  representarlo  gráficamente,  hemos  considerado  el  plano  xy  con  x  =  9  (eje 
de  abscisas)  e  y  =  Có  (eje  de  ordenadas)  y  coloreado  en  rojo  los  valores  de  los  parámetros 
que  verifican  la  condición  x2y  < 


0.00  0.05  0.10  0.15 


Figura  1.5:  Dominio  de  parámetros  del  método  de  Newton  asociado  al  teorema  de  Newton- 
Kantorovich  (teorema  1.53). 


1.6.  Algunas  ecuaciones  no  lineales  en  espacios  de  Ba- 
nach 

La  resolución  de  sistemas  de  ecuaciones  no  lineales  de  la  forma  F(x)  =  0,  donde  F  : 
D  C  — >  Rm  es  una  función  definida  en  un  dominio  abierto  convexo  no  vacío  D ,  es  un 

problema  habitual  de  las  ciencias  y  la  ingeniería.  Es  importante  entonces  destacar  que  los 
conocidos  esquemas  en  diferencias  finitas  permiten  transformar  problemas  continuos,  como 
ecuaciones  integrales  y  ecuaciones  diferenciales,  en  sistemas  de  ecuaciones,  tal  como  vemos 
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a  continuación,  puesto  que  uno  de  los  objetivos  de  este  texto  se  centra  en  la  resolución  de 
sistemas  de  ecuaciones  no  lineales  en  Rm. 


1.6.1.  Ecuaciones  integrales  de  Hammerstein 

Las  ecuaciones  de  Hammerstein  tienen  un  origen  físico  importante  y  surgen  de  la  dinámica 
de  finidos  electromagnéticos  [32].  En  particular,  las  ecuaciones  integrales  no  lineales  de  tipo 
Hammerstein  mixto  son  de  la  forma: 


rb 

x(s)  —  f(s)+  /  G(s,t)H(t,x(t))  dt,  se  [a,  6], 
J  a 


(1.41) 


donde  —  oo  <  a  <  b  <  +oo,  /(s)  es  una  función  continua  dada  en  [a,  b]  y  el  núcleo  G  y  la 
función  H  son  conocidos.  Estas  ecuaciones  aparecieron  a  principios  de  los  años  30  del  siglo 
XX  como  modelos  generales  del  estudio  de  problemas  de  valores  en  la  frontera  semilineales, 
donde  el  núcleo  G(s,  t)  se  presenta  típicamente  como  la  función  de  Green  de  un  operador 
diferencial  ¡21].  Así,  la  ecuación  (1.41)  se  puede  reformular  como  un  problema  de  valores 


en  la  frontera  de  dos  puntos  con  una  cierta  condición  de  contorno  no  lineal  [fij.  También 


aparecen  análogos  mnltidimensionales  de  la  ecuación  (1.41)  como  reformulaciones  de  una 
EDP  elíptica  con  condiciones  de  contorno  no  lineales  ¡33],  Ecuaciones  integrales  como  (1.41) 


aparecen  frecuentemente  en  numerosas  aplicaciones  del  mundo  real  [fij .  Por  ejemplo,  algu¬ 
nos  problemas  considerados  en  la  teoría  vehicular,  la  biología  y  la  teoría  de  colas  llevan  a 
ecuaciones  integrales  de  este  tipo  mi-  Estas  ecuaciones  también  se  aplican  en  la  teoría  de  la 
transferencia  radiactiva,  en  la  teoría  del  transporte  de  neutrones  y  en  la  teoría  cinética  de 
gases  [25].  Destacamos  además  el  papel  significativo  que  juegan  en  varias  aplicaciones  a 
como  por  ejemplo  los  modelos  dinámicos  de  reactores  químicos  [12],  que  están  gobernados 
por  ecuaciones  de  control,  justificando  así  su  estudio  y  resolución 


La  resolución  de  la  ecuación  integral  (1.41 )  es  equivalente  a  resolver  la  ecuación  F(x)  =  0, 
donde  F  :  12  C  C([a,b ])  — »  C([a,b})  y 

[Jr(x)](s)  =  x(s)  —  f(s)  —  í  G(s,t)H(t,x(t))  dt,  se[a,  £>].  (1-42) 

J  a 

Notemos  que,  como  ya  hemos  visto,  C([a,  6])  es  un  espacio  de  Banach  con  la  norma  ||  •  ||oo  y, 


por  tanto,  el  operador  (1.42)  está  definido  entre  dos  espacios  de  Banach. 


Cuando  queremos  aproximar  una  solución  de  la  ecuación  F(x)  =  0,  donde  el  operador  F 


está  definido  por  F  :  D  C 
método  de  Newton 


-A 


en  un  dominio  abierto  convexo  no  vacío  D .  mediante  el 


x0  e  D, 

xn+i  =  xn  -  [F'(xn)]~1F(xn),  n  >  0, 
lo  que  hacemos  es  resolver  el  sistema  de  ecuaciones  lineales  en  cada  paso  dado  por 

F'(xn)(xn+i  -  xn)  =  — F(xn).  (1.43) 

En  cambio,  si  el  operador  es  de  la  forma  F  :  C([a,  b])  -A  C([a,  &]),  no  podemos  utilizar  la  idea 


anterior  porque  no  sabemos  resolver  la  ecuación  integral  que  corresponde  a  la  ecuación  (1.43) 


a  partir  de  (1.42).  Tampoco  podemos  aplicar  directamente  el  método  de  Newton  ya  que  no 
conocemos  el  operador  . 
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Así,  como  primer  paso,  discretizamos  la  ecuación  ( 1.41 )  para  transformarla  en  un  problema 
de  dimensión  finita.  Consideramos  entonces  (1.41)  siendo  el  núcleo  G  la  función  de  Green  en 
[o,  b]  x  [a,  b]  y  aproximamos  la  integral  que  aparece  en  (1.41)  usando  la  siguiente  fórmula  de 
cuadratura  numérica  de  Gauss-Legendre  con  m  nodos 


q{t)  dt  ~ 


Í=  1 


donde  los  nodos  ti  y  los  pesos  son  conocidos. 

Si  denotamos  la  aproximación  de  x(í¿)  por  Xi  y  la  de  /(í¿)  por  ft  (i  =  1,2, ...  ,m),  entonces 
la  ecuación  (1.41)  se  transforma  en  el  siguiente  sistema  de  ecuaciones  no  lineales 


x. 


=  Si  +  E« ,  j  =  1,2, . . .  ,m, 


(1.44) 


3= 1 


donde 


(Sjj  Wj  G(ti,  tj ) 


(b—  a)  .  .  .  . 

Wj  bj.  Si  J  <  h 


w. 


b—a 
( b-tj)(tj-a ) 
b—a 


SI  J  >  l. 


Ahora,  el  sistema  (1.44)  se  puede  escribir  como 

F(x)  Ex-f-dy  =  0, 


F  : 


(1.45) 


donde 

x  =  (x1,x2,. . .  ,xm)T,  f=  (/1,/2,...,/m)r,  A  =  (a¿j)^=1, 
y  =  (H(t  i,  xi),  H(t2,  x2),...,  H(tm,  xm))T. 

Por  otra  parte,  como  los  métodos  iterativos  que  estudiamos  en  este  texto  utilizan  dife¬ 
rencias  divididas  de  primer  orden  en  su  algoritmo  y  en  podemos  considerar  diferencias 
divididas  de  primer  orden  que  no  necesitan  que  la  función  sea  diferenciadle  [37] ,  considerare¬ 
mos  la  diferencia  dividida  de  primer  orden  dada  por  [u,  v;  F]  =  ([u,  v;  F],¿J)™;=1  G  £(Mm,  Mm), 
con 


[u>v;F]u  = 


Uj  -  Vj 


(F¿ (^i  j  •  •  •  i  i  7j+i  j  •  •  •  j  ^m)  Fi (u\ , ,  Uj—i,  Vj, ... ,  um) ) ,  (1.46) 


u  =  (ui,  u2,  ■  ■  ■ ,  Um)T  y  v  =  (iq,  v2, . . . ,  vm)T .  Así,  para  la  función  F  definida  en  (1.45), 


tenemos  [u,  v;  F]  =  I  —  A  diag(z),  donde  z  =  {z\,z2,...,  zm)T  y  Zi  — 
para  todo  i  —  1,2, ...  ,m. 


Uó  Vi 


1.6.2.  Problemas  conservativos 

Es  bien  conocido  que  la  energía  se  disipa  en  la  acción  de  cualquier  sistema  dinámico 
real,  generalmente  a  través  de  algún  tipo  de  fricción.  Sin  embargo,  en  ciertas  situaciones  esta 
disipación  es  tan  lenta  que  se  puede  despreciar  en  periodos  de  tiempo  relativamente  cortos. 
En  tales  casos  se  supone  la  ley  de  conservación  de  la  energía,  es  decir,  que  la  suma  de  la 
energía  cinética  y  la  energía  potencial  sea  constante.  Un  sistema  de  este  tipo  se  dice  que  es 
conservativo. 
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Si  tp  y  0  son  funciones  arbitrarias  con  la  propiedad  de  que  99(0)  =  0  y  0(0)  =  0,  la 
ecuación  general 

dMt)  ,  ,.(**{t)\+v{x{t))  =  o 


/i- 


dt2 


+  tp 


dt 


(1.47) 


se  puede  interpretar  como  la  ecuación  del  movimiento  de  una  masa  /i  bajo  la  acción  de  una 

/  dx  \ 

fuerza  restauradora  — 0  —  .  En  general,  estas  fuerzas  no  son  lineales  y  la  ecuación  (1.47)  se 

\dt 


puede  considerar  como  una  ecuación  básica  de  mecánica  no  lineal.  Ahora  vamos  a  considerar 
el  caso  especial  de  un  sistema  no  lineal  conservativo  descrito  por  la  ecuación 

=  °’  (L48) 

en  la  que  la  fuerza  de  amortiguación  es  nula  y,  en  consecuencia,  no  hay  disipación  de  energía. 
Diversos  estudios  de  (1.47),  con  aplicaciones  a  un  gran  número  de  problemas  físicos,  se  pueden 
encontrar  en  las  referencias  clásicas  070. 

Ahora,  consideramos  el  caso  especial  de  un  sistema  no  lineal  conservativo  descrito  por  la 
ecuación 

d2x(t ) 


dt 2 


+  4>{x(t))  =  0 


con  condiciones  de  contorno 


x(0)  =  x(l)  =  0. 


(1.49) 


(1.50) 


La  resolución  de  la  ecuación  diferencial  (1.49)  es  equivalente  a  resolver  la  ecuación  F(x)  =  0, 
donde  F  :  C2([0, 1])  — »  C([0, 1])  y 

{T(x)](t)  =  FF  +  <t,(x(t)). 

Notemos  que,  como  ya  hemos  visto,  C2([0, 1])  es  un  espacio  de  Banach  con  la  norma  ||x||oo  = 
máx{||x||oo,  Hx'lloo}  teniendo  en  cuenta  que  C( [0, 1] )  es  un  espacio  de  Banach  con  la  norma 
||  ■  Hoo,  de  manera  que  el  operador  anterior  F  está  definido  entre  dos  espacios  de  Banach. 

Tal  y  como  hemos  indicado  anteriormente,  estamos  interesados  en  aproximar  una  solución 
de  una  ecuación  no  lineal  F(x)  =  0,  donde  F  es  un  operador  definido  en  un  dominio  abierto 
convexo  no  vacío  D  de  Rm  y  tal  que  F  :  D  C  Rm  — y  Mm.  Así,  a  continuación,  utilizamos  un 
proceso  de  discretización  para  transformar  el  problema  de  contorno  de  segundo  orden  en  un 
problema  finito-dimensional.  Transformamos  así  el  problema  ( 1.49 )-( 1.50)  en  un  sistema  de 
ecuaciones  no  lineales.  Para  ello,  aproximamos  la  segunda  derivada  por  una  fórmula  numérica 
estándar. 

En  primer  lugar,  introducimos  los  puntos  A  =  jh,  j  —  0, 1, . . . ,  m  +  1,  donde  h  =  - 

m  +  1 

y  m  es  un  entero  apropiado.  El  esquema  es  entonces  designado  por  la  determinación  de  los 
números  Xj  y  se  espera  aproximar  los  valores  x(tj)  de  la  solución  exacta  en  los  puntos  tj.  Una 
aproximación  estándar  para  la  segunda  derivada  en  estos  puntos  es 

Xj- 1  —  2  Xj  +  Xj. |_i 


X.i 


h2 


3  = 


,m, 


de  manera  que  un  procedimiento  natural  para  obtener  dicho  esquema  es  exigir  que  los  Xj  sa¬ 
tisfagan  en  cada  punto  tj  del  interior  de  la  malla  la  ecuación  diferencial  y,  por  la  aproximación 
indicada,  tenemos 

Xj- 1  —  2  Xj  +  Xj+ 1  +  h2(p(xj )  =  0,  (1.51) 
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y  como  xq  y  xm+i  están  determinados  por  las  condiciones  de  contorno,  las  incógnitas  son 

%1  i  %2'>  •  •  •  ? 

Adicionalmente,  simplificamos  mediante  el  uso  de  notación  vectorial  y  matricial.  Introdu¬ 
cimos  entonces  los  vectores 


y  la  matriz 


1  X1  ^ 

(  0(xi)  > 

X2 

0(^2) 

X  = 

i  — 

\  xrn 

\  4>{Xm) 

(  -2 

1  0  •• 

■  0  \ 

A  = 


1-2  1 
0  1-2 


[  0  0  0  •••  -2  j 


0 

o 


de  manera  que  el  sistema  de  ecuaciones,  que  surge  de  imponer  que  (1.51)  se  verifique  para 
j  —  1,  2, . . . ,  m,  se  puede  escribir  como 


F(x)  =  Ax  +  h2vx  =  0, 


(1.52) 


donde  F  es  una  función  de  en  Mm. 

Por  otra  parte,  tal  y  como  hemos  dicho  antes,  al  estudiar  en  este  texto  métodos  itera¬ 
tivos  que  utilizan  diferencias  divididas  de  primer  orden  en  su  algoritmo,  consideraremos  la 
diferencia  dividida  de  primer  orden  dada  por  [u,  v;F]  =  ([u,  v;  F]¿j)™=1  G  con 

[u,  v;  F]ij  definida  en  (1.46),  de  manera  que  en  este  caso 


[u,  v;  F]  =  A  +  fi2diag{z}, 


donde  z  =  (zh  z2, . . . ,  zm)T  y  = 


T _ (f>{Ui)  ~  <t>{Vi) 


Uj'¡ 


,  para  todo  i  —  1,  2, . . . ,  m. 


Terminamos  diciendo  que,  a  lo  largo  de  todo  el  texto,  por  una  parte,  denotamos 

B(x,  g)  =  {y  G  X\  \\y  -  x\\  <  g}  y  B(x,  g)  =  {y  G  X\  \\y  —  x||  <  q}, 

y,  por  otra  parte,  suponemos  que  existen  todas  las  diferencias  divididas  de  primer  orden  para 
cada  par  de  puntos  distintos  del  espacio  de  Banach  X. 


Parte  II 

MÉTODOS  TIPO  SECANTE 
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Como  ya  se  ha  indicado  en  la  introducción  de  este  texto,  uno  de  nuestros  objetivos  princi¬ 
pales  es  el  estudio  de  métodos  iterativos  que  no  utilizan  derivadas  en  su  algoritmo.  En  general, 
estos  métodos  iterativos  tienen  el  inconveniente  de  que  no  es  sencillo  localizar  puntos  de  salida 
a  partir  de  los  cuales  se  asegure  la  convergencia  de  los  mismos. 

En  esta  segunda  parte  del  texto,  centramos  nuestra  atención  en  una  familia  de  métodos 
iterativos  con  memoria,  la  de  los  tipo  secante  que,  en  el  caso  escalar,  viene  dada  por  el 
algoritmo 

(  dados  í_  i  y  t0, 


sn  —  A tn  +  (1  —  A)ín_i,  A  G  [0, 1], 
,  ,  &n  tn 

^71+1  L'T 


f{Sn)  -  f  (tn) 


f(tn),  n  >  0, 


cuando  se  aplica  a  la  ecuación  escalar  f(t)  =  0.  Esta  familia  surge  a  partir  de  las  interpre¬ 
taciones  geométricas  del  método  de  la  secante  y  el  método  de  Newton.  Una  característica 
importante  de  esta  familia  es  que  no  utiliza  derivadas  en  su  algoritmo.  Además,  tiene  A-orden 
de  convergencia  al  menos  super lineal,  1+2  ,  y  a  medida  que  vamos  considerando  mayores  va¬ 
lores  de  A,  próximos  a  uno,  la  velocidad  de  convergencia  aumenta.  Notemos  que  para  A  — *  1 
se  obtiene  el  método  de  Newton,  cuyo  A-orden  de  convergencia  es  al  menos  cuadrático. 

Tal  y  como  hemos  dicho  anteriormente,  son  muchos  los  problemas  de  las  ciencias  y  la 
ingeniería  cuya  resolución  pasa  por  considerar  el  problema  de  aproximar  una  raíz  x*  de  una 
ecuación 

F(x)  =  0. 


Para  contemplar  una  mayor  generalidad  de  la  ecuación  anterior,  vamos  a  considerar  que  F  es 
un  operador  definido  en  un  sub conjunto  abierto  convexo  no  vacío  Í2  de  un  espacio  de  Banach 
X  y  con  valores  en  un  espacio  de  Banach  Y .  En  estas  condiciones  tan  generales,  la  ecuación 
F(x)  =  0  puede  representar  una  ecuación  escalar,  un  sistema  de  ecuaciones,  una  ecuación 
diferencial,  una  ecuación  integral,  etc. 

Comenzamos  extendiendo  la  familia  de  métodos  iterativos  tipo  secante  anterior  a  espacios 
de  Banach  con  el  objetivo  de  aproximar  una  solución  x*  de  la  ecuación  F(x)  =  0,  que  queda 
de  la  siguiente  forma: 


{dados  X-i,  xq  en  £1, 

y n  Xxn  +  (1  A)xn_i,  A  g  [0, 1), 

xn+i  =  xn  -  [yn,  xn\ F]-1F(xn),  n  >  0, 

donde  [x,  y ;  F]  es  un  operador  diferencia  dividida  de  primer  orden  de  F  en  los  puntos  x  e  y. 
Por  una  parte,  tenemos  que  para  A  =  0,  obtenemos  el  método  de  la  secante: 

í  dados  x-i,  xq  en  O, 

\  xn+i  =xn-  [xn_i ,xn;F]-1F(xn),  n  >  0, 


cuyo  A-orden  de  convergencia  es  al  menos  superlineal,  1+2  .  Por  otra  parte,  si  A  =  1  y  el 
operador  F  es  diferenciable,  entonces  yn  =  xn,  [yn,xn]  F]  =  F'(xn)  y  obtenemos  el  método 
de  Newton: 

í  dado  xo  en  Í2, 

\  xn+i  =  xn-  [F'(xn)]~1F(xn),  n  >  0. 
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Aunque  el  método  de  la  secante  es  menos  utilizado  que  el  método  de  Newton,  su  utilización 
tiene  gran  interés  puesto  que  no  requiere  la  evaluación  del  operador  derivada  primera  de  F. 

En  esta  segunda  parte  del  texto  mostramos  el  principal  problema  que  tiene  el  resultado  de 
convergencia  semilocal  dado  para  la  familia  de  métodos  iterativos  tipo  secante  que  se  obtiene 
mediante  una  técnica  basada  en  relaciones  de  recurrencia  [24] .  Es  conocido  que  las  hipótesis 
iniciales  de  todo  resultado  de  convergencia  semilocal  para  métodos  iterativos  tienen  dos  partes 
diferenciadas.  Por  una  parte,  las  condiciones  iniciales  exigidas  a  los  puntos  de  salida;  y  por 
otra,  las  condiciones  exigidas  al  operador  F.  Pues  bien,  aquí  nos  ocuparemos  de  analizar  las 
condiciones  iniciales  para  mejorar  un  resultado  de  convergencia  semilocal  dado  a  partir  de 
relaciones  de  recurrencia.  Para  estudiar  las  restricciones  que  imponen  las  condiciones  iniciales 
utilizaremos  la  región  de  accesibilidad  y  el  dominio  de  parámetros.  El  problema  principal  que 
presenta  el  resultado  de  convergencia  semilocal  dado  a  partir  de  relaciones  de  recurrencia 
corresponde  con  la  situación  que  se  plantea  habitualmente  cuando  aplicamos  los  métodos 
tipo  secante  para  aproximar  una  solución  de  F(x)  =  0:  no  es  sencillo  localizar  puntos  de 
salida  a  partir  de  los  cuales  se  asegure  la  convergencia  de  los  métodos  tipo  secante. 

Resolvemos  el  problema  anterior  mediante  dos  procedimientos.  En  el  capítulo  2,  para  un 
operador  diferenciable  F,  utilizamos  un  método  iterativo  híbrido  de  tipo  predictor-corrector, 
que  es  un  esquema  iterativo  que  facilita  la  aplicación  de  un  método  iterativo,  llamado  co¬ 
rrector,  a  partir  de  la  aplicación  de  otro  método  iterativo,  llamado  predictor,  que  permite 
localizar  puntos  de  salida  a  partir  de  los  cuales  la  convergencia  del  método  corrector  está  ase¬ 
gurada.  La  idea  básica  es  aplicar,  hasta  una  cierta  aproximación  N0,  un  método  iterativo  con 
A-orden  de  convergencia  bajo,  pero  con  buen  dominio  de  puntos  de  salida,  y  utilizar  después 
esta  iteración  como  punto  inicial  para  un  método  iterativo  con  mayor  A-orden  de  convergen¬ 
cia.  La  clave  está  en  el  valor  N0l  que  juega  un  papel  fundamental  en  la  construcción  de  estos 
métodos  iterativos  híbridos.  En  concreto,  en  el  capítulo  2,  utilizamos  un  método  iterativo 
híbrido  (predictor-corrector)  que  facilita  la  aplicabilidad  de  los  métodos  tipo  secante  a  partir 
del  método  simplificado  de  la  secante  (convergencia  lineal),  permitiendo  así  localizar  puntos 
de  salida,  a  partir  de  los  cuales  esté  asegurada  la  convergencia  de  los  métodos  iterativos  tipo 
secante,  y  aprovechar  entonces  su  convergencia  superlineal.  En  el  capítulo  3,  obraremos  de 
forma  diferente  y  utilizaremos  una  modificación  de  la  técnica  basada  en  relaciones  de  re¬ 
currencia  para  obtener  un  resultado  de  convergencia  semilocal  para  la  familia  de  métodos 
tipo  secante,  que  es  menos  exigente  a  la  hora  de  obtener  puntos  de  salida  adecuados  para 
estos  métodos.  Además,  el  nuevo  resultado  de  convergencia  semilocal  que  se  obtiene  tiene  la 
ventaja  de  que  se  puede  aplicar  a  la  resolución  de  ecuaciones  en  las  que  el  operador  implicado 
F  es  tanto  diferenciable  como  no  diferenciable. 


Capítulo  2 

Situación  diferenciable 


En  este  capítulo,  como  ya  hemos  indicado,  teniendo  en  cuenta  la  deficiente  accesibilidad 
que  presentan  los  métodos  iterativos  que  no  utilizan  derivadas  y,  en  particular,  los  métodos  ti¬ 
po  secante,  nos  planteamos  mejorar  su  accesibilidad.  Para  conseguir  este  objetivo,  planteamos 
la  construcción  de  un  método  iterativo  híbrido  (predictor-corrector). 


En  la  sección  2.1.1  presentamos  un  conocido  resultado  de  convergencia  semilocal  para 


los  métodos  tipo  secante,  lo  analizamos  mediante  regiones  de  accesibilidad  y  el  dominio  de 


parámetros  asociado  y  vemos  cuáles  son  las  deficiencias  que  presenta.  En  la  sección  2.2.1 


una  vez  detectado  correctamente  el  problema  de  la  deficiente  accesibilidad  de  los  métodos 
tipo  secante,  a  partir  del  resultado  de  convergencia  semilocal  presentado,  consideramos,  para 
resolverlo,  el  método  simplificado  de  la  secante  en  espacios  de  Banach, 


dados  Z-i,zo  en  O, 

Zn+l  =  Zn  -  [Z-l,  2o;  F]-1F(2„),  71  >  0, 


(2.1) 


cuyo  i?-orden  de  convergencia  es  al  menos  lineal,  con  el  objetivo  principal  de  construir  un 
método  iterativo  híbrido  (predictor-corrector)  que  utilice  el  método  simplificado  de  la  se¬ 


cante  (2.1)  como  predictor  y  la  familia  de  métodos  tipo  secante  como  corrector.  Para  ello, 


analizamos  la  convergencia  semilocal  del  método  simplificado  de  la  secante  (2.1)  y,  como  las 


condiciones  de  convergencia  impuestas  a  este  método  son  menos  restrictivas  que  las  impues¬ 
tas  previamente  a  los  métodos  tipo  secante,  vemos  que  se  pueden  mejorar  las  regiones  de 
accesibilidad  y  los  dominios  de  parámetros  de  los  métodos  tipo  secante  a  partir  del  método 


simplificado  de  la  secante  (2.1).  Así,  en  la  sección  2.3  mediante  el  método  iterativo  híbrido 


(predictor-corrector)  construido,  garantizamos  la  convergencia  de  los  métodos  tipo  secante 
saliendo  desde  los  mismos  puntos  de  salida  a  partir  de  los  cuales  está  garantizada  la  conver¬ 


gencia  del  método  simplificado  de  la  secante  (2.1).  Finalmente,  en  la  sección  2.4,  ilustramos 


todo  lo  anterior  con  la  resolución  de  un  sistema  de  ecuaciones  no  lineales. 


2.1.  Método  corrector:  los  métodos  tipo  secante 

2.1.1.  Convergencia  semilocal 

En  esta  sección  presentamos  un  resultado  de  convergencia  semilocal  para  los  métodos  tipo 
secante  y  en  el  que  la  técnica  de  demostración  está  basada  en  relaciones  de  recurrencia.  Para 
ello,  suponemos  que  se  cumplen  las  siguientes  condiciones  iniciales: 
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(Cl)  ||xo  —  x_i||  =  a  0  con  x-x,  xq  G  O, 

(C2)  fijado  A  G  [0,1),  existe  A^1  =  [y0,  x0;  F}^1  G  £(Y,  X),  para  x0,y0  G  ó,  y  es 
tal  que  que  H^o1!!  <  /?, 

(C3)  ||i4¿-1F(*0)||  <ú, 

(C4)  ||  [x,y,F\  -  [u,v,F]  ||  <  ür(||a;  — 1¿||  +  ||2/-u||);  K  >  0;  x,y,u,v  GÍl;i^i/, 
u  7^  v. 

En  primer  lugar,  se  definen  las  siguientes  sucesiones  de  números  reales  positivos: 

f  ifln—  í)9Ífln—  1  )^n—  1  j  ^ n  f  ifln— l)  ®n— l^n— 1;  Cl  ^  0,  (2.2) 


donde 


ú 

ce  +  r/’ 


a0  =  /(a_i)^(a_i)6_i, 


Jú/fo2 

ce  +  y  ’ 


/(í)  —  -  —  <?(t)  —  (1  —  A)  +  (1  +  A )/(£)£,  A  G  [0, 1). 


(2.3) 


Notemos  que  tanto  /(£)  como  g(t)  son  funciones  crecientes  en  R  -  {1}  y,  además,  /(£)  >  1 
en  (0, 1). 

A  partir  de  las  condiciones  iniciales  (C1)-(C4),  si  X\  está  bien  definido,  se  deduce  que 
existe  Aq1  =  [t/o,  Xq;  F]~l  y 


Xi  -  ccoll  =  ||A01F(a;o)||  <  rj  =  /(a_i)a_i||x0  -  x_i||, 
iú||xi  -  x0||  ||x0  -  x_i||  <  K¡3a  =  /(a_i)6_i. 


(2.4) 


A  continuación,  se  prueban,  mediante  inducción  matemática  sobre  n,  las  siguientes  tres 
relaciones  de  recurrencia  para  n  >  1: 

(*n)  Existe  A"1  =  [j/n  -  x^E]”1  y  es  tal  que  H^-1 1|  <  /(an_i)||A“i;1||, 

(íín)  ||xn+l  X„||  A  ./ (®n~l)®n— 1  ||Xn  Xn_i||, 

(iiin)  AljA^  ||||xn  Xn_i||  U  J (cin_i^bn—i . 


Veámoslo  para  n  =  1.  Suponiendo  que  a0  <  1  y  Si  G  O,  de  (2.3)  y  (2.4),  se  sigue: 
||J  — Aq^iH  <  ||A0 1||  ||A0  —  Ai|| 

<  Pol  (llz/1  —  2/o||  +  Iki  -x0\\) 

—  K\\A0 1||  [(1  —  A)  +  (1  +  A)/(a_i)a_i]  ||xo  —  x_i|| 

<  a0 

<  1. 


Entonces,  por  cl  lema  de  Banach  (lema  1.22),  existe  A1  y  es  tal  que 


II Ax  1 1|  <  /(a0)||A0 1 


Por  tanto,  se  cumple  (A)- 


2.1.  MÉTODO  CORRECTOR:  LOS  MÉTODOS  TIPO  SECANTE 
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Ahora,  usando  la  fórmula  de  Taylor  (teorema  1.38) 

F(xi)  =  (F'(x o)  -  A0)  ( x i  -  x0)  +  f  {F'{x o  +  t(x1  -  x0))  -  F'(x 0))  (a^  -  x0)dt, 

Jo 

y  teniendo  en  cuenta  que  F  es  diferenciable  por  cumplirse  (C4),  lema  1.43,  etonces  [x,  x ;  F]  = 
F'(x)  y 

IA0d)II  <  K((l  -  A)||x0:;-  x_i||  +  ||zi  -  x0||)  Iki  “®o|| 

<  Kg(a_i)\\x0  —  x_i||||xi  —  x0||. 

Como  Ai 1  existe,  si  X2  está  bien  definido,  se  sigue 

11^2  -  a;i||  <  /(a0)||Aó1||||F(a;i)||  <  /(a0)a0||xi  -  x0|| 


y  tenemos  (íí2). 

Notemos  que,  como  consecuencia  de  (2.4)  y  (¿i),  se  sigue  (mi),  puesto  que 

A'||A"1||||x1  -  x0||  <  A7(a0)||Aó1||||xi  -  x0||  <  f{a0)b0. 

Finalmente,  suponiendo  an  <  1  y  xn  G  fl,  para  todo  n  >  1,  el  paso  inductivo  (in+ i)- 
(üin+i)  se  demuestra  de  forma  totalmente  análoga  y  se  completa  la  inducción. 

En  segundo  lugar,  para  probar  la  convergencia  de  la  sucesión  {xn}  que  definen  los  métodos 


tipo  secante,  se  estudian  las  sucesiones  reales  definidas  en  (2.2).  Debemos  probar  que  {xn} 


es  una  sucesión  de  Cauchy  contenida  en  Q  y  que  an  <  1,  para  todo  n  >  0. 

Se  empieza  denotando  la  sucesión  de  Fibonacci  por  {<5n},  que  se  define  como  sigue 

Si  =  S2  =  \  y  Sn+2  =  án+i  +  án,  n  >  1, 

Sn  —  S\  +  ¿2  +  '  '  '  +  Sn,  n  ^  1, 
y  se  demuestran  por  inducción  las  siguientes  dos  propiedades: 


Sn.  = 


V5 


'1  +  75n 


V/5N 


1  (l  +  y/5' 

"V5V  2  , 


71—1 


n  >  1. 


•  —  án+2  “  1  y  -  S1  +  *2  +  1  "  +  s„  -  ín+4  —  (u  +  3)  n  >  1. 

Para  mayor  detalle,  consúltese  m- 

A  continuación,  presentamos  algunas  propiedades  de  las  sucesiones  {an}  y  {bn},  dadas  en 


(2.2),  en  el  siguiente  lema. 


Lema  2.1.  Sean  las  sucesiones  {an}  y  {bn}  definidas  en  (2.2)  y  A  e  [0, 1)  fijo.  Si 


r¡  3- 

a_i  = - <  - 

a  +  r¡  2 


Kf3a2  a_i(l  —  a_i)2 

b_i  = - < 


ol  T  t¡  1  T  A(2a_!  —  1) 


(2,5) 


entonces 


(i)  {<úi}  V  {¿*77.}  son  sucesiones  decrecientes , 
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(iii)  an  <  (pSnan-i  y  bn  <  ip5n+1bn_ 1;  para  todo  n  >  1, 

(iv )  an  <  tpSna0,  para  todo  n  >  1. 

Demostración.  Para  probar  (i),  procedemos  por  inducción.  De  las  hipótesis  se  tiene 
que  a0  <  a_i  y  b0  <  b_i.  Si  se  verifican  a3_ i  >  a3  y  h,_i  >  bj ,  para  j  —  0, 1, . . . ,  n,  entonces 

®n+ 1  U  f  (on—i) í?(®n— l)^n— 1  y  ++1  U  /'(Urí— l)  ®n—  l^n— 1  bn. 

Luego  {an}  y  {+}  son  decrecientes. 

El  apartado  (ii)  es  inmediato  por  hipótesis. 

Para  probar  (iii),  aplicamos  inducción.  De  a0  <  a_i  y  b0  <  <pb_ i  se  deduce  que 

ai  <  f(an_i)g(an_i)(pb_\  =  ¡pa0  y  íq  <  /(an_i)2+a_i+&_i  = 

Si  suponemos  bj  <  (pSj+ibj_i,  para  j  —  1, 2. . . . ,  n,  entonces 

an+i  <  f  (an_i)g(an_i)<p5n+1bn_i  =  ipSn+2an, 

bn+i  <  f  {an-i)2 (y11  g(an-i))Lp5n+lbn_i  <  ip5n+1+5nbn  =  <p5n+2an. 

Finalmente,  (iv)  es  consecuencia  de  (iii).  ■ 


A  continuación,  probamos  el  teorema  de  convergencia  semilocal. 


Teorema  2.2.  Sean  X  e  Y  dos  espacios  de  Banach,  F  :  O  C  X  -A  Y  un  operador  definido 
en  un  conjunto  abierto  convexo  no  vacío  O  y  A  G  [0,1).  Suponemos  que  se  cumplen  las 

condiciones  (Cl)-(Cj)  y  (2.5).  Si  B(x0lr0 )  C  ó,  donde  r0  =  - - 7T~7h  entonces  los  métodos 

1  —  ¿cío 


tipo  secante  convergen  a  una  solución  x *  de  F{x )  =  0.  Además,  xn,x *  G  B(xo,ro)  y  x *  es 
única  en  B[x o,  r)  fl  fl,  donde  r  =  —  ro  —  (1  —  \)a. 


Demostración.  Tenemos  que  a0  <  1  y  an  <  1  para  todo  n  >  1.  Veamos  que  {xn}  es 
una  sucesión  de  Cauchy  y  que  xn  G  B(x0,r0),  para  todo  n  >  0.  Ahora,  para  m  >  1,  vemos 
que 


H^n+m  ||  A  ||^n+m  ^n+m— 1||  T  ||^n+m— 1  %n-\-m— 2  1 1  T  *  *  *  T  ||xn_|_i  Xr 

—  f  [&n+m—2)&n+m—2  '  '  '  f  {^Q,ri)QJri\%n-\-l  *^7i|| 

T  f  (^77+772— 3)^77+777— 3  *  f  (^ti+I ) ^77+1  f  (^77)^72 1| ^n+1  "^77  || 

T  *  *  *  T  f  (CL'nj&n  ||  ^77+1  *£77  ||  T  ||^77+1  *^''77  1 1 

77+777—2  í  i  \  \ 

1+  e  n  /(%)%  ||xn+i  -x„||. 

i=n  \j=n  J  J 


(2.6) 


Como  {a+  es  decreciente  y  /  es  creciente,  por  el  lema  2.1  y  (2.6),  para  n  >  2,  se  tiene 


77+777—2 


Ibn+m-ZnlH  JJ  ^A"  A™"1  +  A™"2  +  ■  ■  ■  +  1 


Fi  -  £0||, 


j=n 
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donde  A  =  <  1  y,  por  tanto,  üq  <  Entonces, 


ll^'n+m  Xn\\ 


_  (  ,  nSl~\-S2~\ - l“Sn  — 1 


An(l  -  Ar 
1  -  A 


Iki  -  A)||- 


En  (2.6),  si  n  —  1,  se  tiene 


n  n  A(l-Am) 

\\Xm+l  ~  ÍCl||  <  - q - X - 11^1  _  X0||, 


1  -  A 


y,  si  n  =  0, 


1  -  Ar 


V 


\xm  ~  Xq\\  <  1  _  A  <  1  _  A  =  T-o . 


(2.7) 


(2.8) 


(2.9) 


Por  tanto,  xn  G  B(x0,r0),  para  todo  n  >  1,  la  sucesión  {xn}  está  bien  definida  y  es  una 
sucesión  de  Cauchy.  Luego,  lím  xn  =  x*  G  B(xn,r0). 

TI — ^OO 

Además,  por  (C4),  existe  F'  y  cumple  ||F'(a;)— F'(|/)||  =  \\[x,x;  F]  —  [y,y,  F]\\  <2K\\x—y\\, 
de  manera  que 

F(xn)  {.F  (xn— i)  An_i)  (ícn  xn_i)  T  í  (F  (xn_i -\-t(xn  xn_i ))  F  (xn—  \)(xn  xn—\ )  di, 

Jo 

II  F^Xn)  ||  A  F  (  (1  A)  1 1  íCn —  1  %n— 2 1  F  |  Xn  Xn—  \  ||  )  ||  Xn  Xn—\  1 1 , 

lím  ||F(a;n)||  =  0  y,  por  la  continuidad  de  F,  vemos  que  x*  es  solución  de  F(x)  =  0,  puesto 

que  ife  =  =  °- 

A  continuación,  probamos  la  unicidad  de  x*.  Sea  z*  otra  solución  distinta  de  F(x)  =  0  en 
B{x o,  r)  D  Í2,  donde  r  =  —  r0  —  (1  —  A)a.  Si  consideramos 

F(z*)-F(x*)=  I"  F’(x)dx=  f1  F'  (x*  F  t(z*  —  x*))  (z*  —  x*)dt  —  0, 

J x*  Jo 

y  el  operador  J  —  F'  (x*  +  t(z*  —  x*))  dt ,  entonces 
Jo 

||/-Aó1J||  <  || Vil  II A)-  J\\ 

<  ||V||  í1\\F,(x*  +  t(z*-x*))-A0\\dt 

Jo 

=  ||Vll  f1  \\F'  (x*  F  t(z*  —  x*))  —  F'(x0)  F  F'(xq)  —  A0||  dt 
Jo 

<  ¡3  2K\\x* +  t(z*  —  x*)  —  x0\\dt+\\F'(x0)  —  AqW'J 

<  ¡3  i^J  2K((1  —  t)\\x*  ~  xo\\  +  t\\z*  —  xo\\)  dt  +  K(1  —  \)a^ 

=  K/3  ((1  -  A)a  +  ||x*  -  x0||  +  ||z*  -  x0||) 

<  K/3  ((1  —  X)a  +  r0  +  t) 

=  1, 


de  manera  que  J  es  inversible  y,  por  tanto,  z*  —  x*. 
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2.1.2.  Accesibilidad 


Sabemos  que  los  puntos  de  salida  de  un  método  iterativo  tienen  asociados  los  parámetros 
dados  en  las  condiciones  iniciales.  Para  representar  la  región  de  accesibilidad  del  método 
iterativo,  coloreamos  los  puntos  cuyos  parámetros  asociados  verifican  las  condiciones  de  con¬ 
vergencia  y,  en  otro  caso,  no  los  coloreamos.  La  región  de  accesibilidad  asociada  a  una  solución 
de  F(x)  =  0  nos  indica  entonces  el  dominio  de  puntos  de  salida  a  partir  de  los  cuales  tenemos 
asegurada  la  convergencia  del  método  iterativo  que  se  aplica;  es  decir,  el  conjunto  de  puntos 
de  salida  que  satisfacen  las  condiciones  de  convergencia  impuestas  al  método  iterativo. 

A  continuación,  vemos  cuál  es  la  región  de  accesibilidad  asociada  a  la  raíz  z  =  1  de  la 
ecuación  compleja  F(z)  =  z3  —  1  =  0  cuando  se  aproxima  mediante  los  métodos  tipo  secan¬ 
te.  Considerando  el  cuadrado  [0.9, 1.3]  x  [—0.2,  0.2]  como  dominio  complejo,  que  únicamente 
contiene  la  raíz  z  —  1,  obtenemos  Ií  =  6 1 1.3  +  0.2i|  =  3.9458. .  .  Tomando  z~\  =  Zo  —  d, 
representamos  la  región  de  accesibilidad  coloreando  los  puntos  Zq  que  verifiquen  las  condi- 


(2.5 

).  Así,  fijado  a  = 

O 

1 

1 

=  \d  ,  en  las  figuras  2.1- 

2.4 

se  muestran  las  regiones  de  accesibilidad  para  cuatro  métodos  tipo  secante:  A  =  0  (región 
verde),  A  =  \  (región  rosa),  A  =  \  (región  amarilla)  y  A  =  |  (región  morada). 

Se  observa  entonces  que  las  regiones  de  accesibilidad  de  los  métodos  tipo  secante  que  se  han 
representado  gráficamente  tienen  el  problema  de  que  no  se  puede  garantizar  la  convergencia 
para  ciertos  valores  de  A,  aún  estando  cerca  de  la  raíz  o  en  la  misma  raíz.  Vemos  que  aparece 
una  zona  hueca  en  la  región  de  accesibilidad  que  contiene  a  la  propia  raíz.  Evidentemente,  esta 
restricción  es  consecuencia  de  que  la  distancia  entre  los  puntos  de  salida  (o,  equivalentemente, 
del  valor  de  a)  no  es  suficientemente  pequeña  como  para  poder  garantizar  la  convergencia  en 
estas  situaciones  concretas. 

Por  otra  parte,  si  se  consideran  valores  de  a  más  pequeños,  se  puede  ver  en  las  figuras  [275]- 


2.8  que,  aunque  se  va  reduciendo  la  zona  hueca,  también  se  reduce  la  región  de  accesibilidad. 


De  hecho,  se  puede  comprobar  que  para  a  =  1/64  ya  no  existe  región  de  accesibilidad,  como 


consecuencia  de  que  las  condiciones  (2.10)  no  se  cumplen. 


A  continuación,  estudiando  el  dominio  de  parámetros  asociado  al  teorema  2.2 


vamos  a 


detallar  cuáles  son  los  problemas  de  accesibilidad  de  los  métodos  tipo  secante.  Para  represen¬ 
tarlo  gráficamente,  se  colorean  en  un  plano  xy  los  valores  de  los  parámetros  correspondientes 
a  los  puntos  de  salida  que  verifican  las  condiciones  que  se  imponen  en  el  teorema |2.2|  Observa¬ 
mos  que  las  condiciones  exigidas  a  los  puntos  de  salida,  (C1)-(C3),  introducen  los  parámetros 
a,  ¡3  y  rj,  y  la  condición  exigida  al  operador  F ,  (C4),  introduce  el  parámetro  fijo  K .  En  primer 
lugar,  expresamos  las  dos  condiciones  dadas  en  (|2.5)  de  forma  explícita  a  partir  de  los  valo¬ 
res  que  consideramos  para  construir  el  dominio  de  parámetros:  K¡3rj  y  K/3a.  Así,  podemos 


escribir  (2.5)  de  la  siguiente  forma: 

3-V5 


K/3r¡ 


< 


1  < 


KBy 


(2.10) 


K/3a  +  Kf3r]  2  17  ‘  '  (Kfia  +  Kf3y){Kpa  +  Rfiy  +  X(K/3y  -  Kf3a) ' 

Ahora,  considerando  que  representamos  en  el  eje  x  de  abscisas  los  valores  Kf3r¡  y  en  el 


y  de  ordenadas  los  valores  K/3a,  dibujamos  en  la  figura  2.9  los  dominios  de  parámetros  que 


están  sujetos  a  las  condiciones  dadas  en  (2.10)  para  cuatro  métodos  tipo  secante:  A  =  0 


(región  verde),  A  =  0.25  (región  rosa),  A  =  0.5  (región  amarilla)  y  A  =  0.75  (región  morada). 
Notamos  que  las  regiones  están  superpuestas. 


A  partir  de  la  figura  |2.9|  observamos  dos  situaciones  que  destacamos  a  continuación.  En 
primer  lugar,  la  elección  de  adecuados  puntos  de  salida  x_i  y  x0  para  los  métodos  tipo  secante 
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Figura  2.1:  Región  de  accesibilidad  de  la 
raíz  z  =  1  de  la  ecuación  F(z)  =  z3  —  1  =  0 
para  el  método  tipo  secante  correspondiente 
a  A  =  0  y  tomando  a  =  A 


Figura  2.2:  Región  de  accesibilidad  de  la 
raíz  ^  =  1  de  la  ecuación  F(z)  =  z3  —  1  =  0 
para  el  método  tipo  secante  correspondiente 
a  A  =  |  y  tomando  a  —  A. 


es  muy  restrictiva,  puesto  que  el  dominio  de  parámetros  es  muy  reducido.  En  segundo  lugar, 
si  consideramos  un  valor  fijo  de  Kf3a  perteneciente  al  dominio  de  parámetros,  observamos 
que  los  posibles  valores  que  se  pueden  considerar  de  K¡3r),  para  que  los  puntos  de  salida 
pertenezcan  al  dominio  de  parámetros,  tienen  una  cota  superior  y  una  cota  inferior  para  la 
cantidad  K/3r).  Esto  hace  que,  incluso  tomando  la  propia  raíz  como  punto  de  salida  ( K/3r¡  = 
0),  no  obtengamos  puntos  iniciales  que  verifiquen  las  condiciones  del  teorema  2.2,  lo  que 


resulta  evidente  a  partir  de  la  segunda  condición  de  (2.10),  puesto  que  obviamente  nunca  se 


verifica  la  desigualdad  para  a  >  0  y  7]  =  0  (es  decir,  xq  =  x*). 


2.2.  Método  predictor:  el  método  simplificado  de  la  se¬ 
cante 


Una  vez  descritos  los  problemas  de  accesibilidad  que  se  deducen  del  teorema  2.2  para  los 


métodos  tipo  secante,  introducimos  ahora  el  método  simplificado  de  la  secante  (2.1 )  y  analiza¬ 


mos  su  convergencia  semilocal.  A  partir  de  este  estudio,  veremos  que  este  método  tiene  mejor 
accesibilidad  que  los  método  tipo  secante,  lo  que  posteriormente  utilizamos  para  considerarlo 
como  método  predictor  del  método  híbrido  (predictor-corrector)  que  construimos. 


2.2.1.  Convergencia  semilocal 


Para  probar  la  convergencia  semilocal  del  método  simplificado  de  la  secante  (2.1),  supo¬ 
nemos  que  se  cumplen  las  siguientes  condiciones  iniciales: 


(Hl)  \\zq  -  z-x 


«o  7^  0,  con  z_!,  z0  G  Í2, 
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0.9  1.0  1.1  1.2  1.3 


Figura  2.3:  Región  de  accesibilidad  de  la 
raíz  z  =  1  de  la  ecuación  F(z)  =  z3  —  1  =  0 
para  el  método  tipo  secante  correspondiente 
a  A  =  |  y  tomando  a  —  A. 


0.9  1.0  1.1  1.2  1.3 


Figura  2.4:  Región  de  accesibilidad  de  la 
raíz  z  =  1  de  la  ecuación  F(z)  =  z3  —  1  =  0 
para  el  método  tipo  secante  correspondiente 
a  A  =  |  y  tomando  a  —  A. 


(H2)  existe  L0 1  =  [z-\,zq\F]  1  £  C(Y,X),  para  Z-i,zq  £  ó,  y  es  tal  que 

ll^ól  <  7, 

(H3)  ||Ló1^(-o)||  <£, 

(H4)  \\[z,y;F\~[u,v,F\\\  <  K(\\z -u\\  +  \\y -v\\),  K  >  0,  z,  y,  u,  v  £  ó,  z^y, 
u  7^  v. 


Antes  de  probar  la  convergencia  semilocal  del  método  simplificado  de  la  secante  (2.1)  bajo 
las  condiciones  (H1)-(H4),  probamos  el  siguiente  lema  técnico. 


Lema  2.3.  A  partir  de  (H1  )-(HJh ),  si 


K'yao  <  1 


Kj£  < 


U2(l  +  T7<*o)2)  -  (1  +  A'7«o) 


(2.11) 


entonces  la  ecuación 


2/i yt2  —  (1  —  K'ya  0  +  2Kye)t  +  (1  +  Kye)e  =  0 


(2.12) 


tiene  dos  raíces  reales  positivas.  Si  denotamos  por  R  la  menor  de  ellas,  se  tiene  que  Ky(2R  + 

a0)  <1  y  R  >  £■ 


Demostración.  Como  el  discriminante  de  la  ecuación  (2.12)  está  dado  por 


A  =  (1  —  Kya0  +  2/i ye)2  —  8Kye(l  +  Kye) 

=  ((1  -  K^a0  +  2/i' ye)  +  ^8Kye{l  +  ~K yej) 

x  ((1  —  Kya0  +  2Kye)  —  ^8Kye{l  +  Kye)^j  , 
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0.9  1.0  1.1  1.2  1.3 


0.9  1.0  1.1  1.2  1.3 


Figura  2.5:  Región  de  accesibilidad  de  la 
raíz  z  =  1  de  la  ecuación  F(z)  =  z3  —  1  =  0 
para  el  método  tipo  secante  correspondiente 
a  A  =  0  y  tomando  a  =  A 


Figura  2.6:  Región  de  accesibilidad  de  la 
raíz  ^  =  1  de  la  ecuación  F(z)  =  z3  —  1  =  0 
para  el  método  tipo  secante  correspondiente 
a  A  =  |  y  tomando  a  —  A. 


la  ecuación  (2.12)  tiene  dos  raíces  reales  si  y  solo  si  A  >  0.  Analizamos  ahora  los  dos  factores 


de  A.  Por  hipótesis,  tenemos  que  /17a o  <  1,  de  manera  que  A  >  0  si 


1  —  iCycto  +  2Kj£  >  +  A'qe), 


y  operando  llegamos  a 


(1  —  K'yao)2  —  4(1  +  K'ya0)Krye  —  A(K"f£)2  >  0, 


que  conduce  a  la  segunda  condición  de  (2.11). 
Notemos  que 


1  —  K'ya o  +  2K'js  >  \J%K^£{1  +  Kje)  >  0, 


de  manera  que  la  menor  raíz  real  positiva  de  (2.12)  es: 


1  —  K'-yao  +  2K^£  —  J\  1  —  A"7«o)2  —  4(1  +  !Oyao)Kj£  —  A(K^£)2 

R  = - 777 - •  (2.13) 

4A7 

Probamos  a  continuación  que  K -y(2R+c¿o)  <  1.  Para  ello,  probamos  previamente  que  Kry(2,£+ 


«o)  <  1.  A  partir  de  la  segunda  condición  de  (2.11),  tenemos 


A'qao  +  2K^£  <  \J2{1  +  (A'7cc0)2)  -  1- 


Además,  como 


\/2(l  +  (A7«0)2)  -  1  <  1, 
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0.9  1.0  1.1  1.2  1.3 


Figura  2.7:  Región  de  accesibilidad  de  la 
raíz  z  =  1  de  la  ecuación  F(z)  =  z3  —  1  =  0 
para  el  método  tipo  secante  correspondiente 
a  A  =  |  y  tomando  a  =  F. 


Figura  2.8:  Región  de  accesibilidad  de  la 
raíz  z  =  1  de  la  ecuación  F(z)  =  z3  —  1  =  0 
para  el  método  tipo  secante  correspondiente 
a  A  =  |  y  tomando  a  —  F. 


ya  que  2(l  +  (/\7ao)2)  <  4,  por  verificarse  K'yao  <  1,  tenemos  Krya0-\-2Kry£  =  K'y(ao+2e)  < 
1.  Ahora,  observamos  que  la  condición  K^(2R  +  a0)  <  1  es  equivalente  a  la  condición 


1  +  Kjao  +  2Ií'ye  —  \J { 1  —  K'ya 0  +  2K ye)2  —  8A"y£(l  +  K^e)  <  2, 
que  se  satisface  trivialmente  porque  K^y(a0  +  2e)  <  1.  La  desigualdad  R  >  e  resulta  fácil  de 


probar  a  partir  de  (2.13) 


Observemos  que  en  el  resultado  anterior  también  podemos  considerar  la  existencia  de  una 
raíz  doble.  Para  ello,  basta  considerar  las  desigualdades  no  estrictas. 

A  continuación,  damos  un  lema  técnico  para  la  sucesión  {zn}  dada  por  el  método  simpli¬ 


ficado  de  la  secante  (2.1). 


Lema  2.4.  Sea  {zn}  la  sucesión  dada  por  el  método  simplificado  de  la  secante  (2.1).  Supon¬ 
gamos  (H1  )-(HJh ).  Si  zn- 1  7^  zn  con  zn- ¡ ,  zn  e  O,  entonces 

(i)  F{zn)  =  (Ln  -  L0)(zn  -  zn_ i),  donde  L0  =  [z- 1,  z0 ;  F]  y  Ln  =  [zn-X,  zn ;  F], 

(ii)  \\zn+i  -  Zn  ||  <  K^f(\\zn  -  z0\\  +  ||z„_i  -  ||  +  \\Zo  ~  2-l||)||2n  ~  ¿n- 1||- 


DemostraciÓn.  A  partir  del  algoritmo  del  método  simplificado  de  la  secante  (2.1), 
tenemos  F(zn_ i)  +  L0(zn  —  zn_ i)  =  0,  de  manera  que 


F(zn)  F(zn)  R(^n—  l)  Aü  (Zn  ^n—  l)  (-^n  ^n— l)- 
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Figura  2.9:  Dominios  de  parámetros  de  los  métodos  tipo  secante  asociados  al  teorema  |2.2 
cuando  X  —  0,  |  (regiones  verde,  rosa,  amarilla  y  morada,  respectivamente). 


Por  otra  parte, 

Wzn+i-ZnW  <  ||Ló1||||F(^n)|| 

—  1 1  ^0  lili  Fn  Éo  1 1  1 1  Z n  Zn—  1 1 1 
<  K^(\\zn  -  zqII  +  \\zn-i  -  z-i\ 


Zn—  1 


<  K^f(\\zn  -  Zoll  +  \\zn-i  -  z0\\  +  \\z0  -  Z—1 1 


*71—1 


A  continuación,  presentamos  el  siguiente  resultado  de  convergencia  semilocal  para  el  mé¬ 
todo  simplificado  de  la  secante  (2.1). 


Teorema  2.5.  Sean  X  e  Y  dos  espacios  de  Banach  y  F  :  O  C  X  — >•  T  un  operador  definido 
en  un  conjunto  abierto  convexo  no  vacio  Í2.  Suponemos  que  se  cumplen  las  condiciones  (Hl)- 


(Hj)  y  (2.11).  Si  B(zq,R)  C  Cl,  con  R  dado  en  (2.13),  entonces  la  sucesión  {zn}  dada  por 


el  método  simplificado  de  la  secante  (2.1)  está  bien  definida  y  converge  a  una  solución  z* 


de  la  ecuación  F(x)  =  0.  Además  zn,z*  G  B{zq,R)  y  z*  es  única  en  B(zo,r)  fl  Í2,  donde 
r  =  A-  ~  R  -  a0. 

Demostración.  Comenzamos  probando  qne  la  sucesión  {zn}  está  bien  definida;  es  decir, 
zn  G  B(zo,R)  C  Í2,  para  todo  n  G  N.  Lo  haremos  por  inducción  matemática  sobre  n.  En 
primer  lugar,  consideramos  z±  =  zq  —  L(  1F(zq),  donde  L0  =  [z_i,  zq;  F].  En  este  caso,  por  el 


lema  2.3,  tenemos 


Z\  -  z0\\  =  ||L0  Fizo)\\  <e  <  R. 


Luego,  z i  G  B(zq,  R)  C  D  y  podemos  definir  z2  =  Z\ 


Lól 


F(z  i). 


A  continuación,  por  el  lema  2.4  tenemos 


\z2  -  *i||  <  K^(\\zi  -  z0||  +  ||*o  -  *-i||)IId  -  ¿olí  <  K^{e  +  a0)e. 
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Por  tanto,  de  (2.12),  (2.13)  y  K^/{2R  +  a0)  <  1,  se  sigue 

\\z2  -z0\\  <  \\z2  -  Zx\\  +  \\z-l  -  zQ\ 

<  (1  +  K^{e  +  a0))e 

Kj(e  +  a0) 


< 


1  + 


1  -  K'y(2R  +  «o), 


=  R. 


Luego,  z2  G  B(z0j  R)  C  ó  y  podemos  definir  z3  =  z2  —  Lq  1B{z2). 

Utilizando  inducción  matemática  sobre  n,  suponemos  que  Zj  e  B(z0,R)  C  ó,  para  j  = 
2,3, ...  ,n, 

|| Zn  — n— 1||  “í  K'y(2R  T  Qío)||— n— 1  — ra—  2  ||) 

\\zn  —  -o||  <  +  K”i(e  +  a0)  (K^(2R,  +  «o))*^  s  <  R. 

Entonces,  zn+\  =  zn  —  LQ1F(zn)  está  bien  definido.  Además, 

\\zn+i-zn\\  <  K'Y(\\zn-z0\\  +  \\zn_1-z0\\  +  \\z0-Z-i\\)\\zn-zn_1\\  <  K j(2R  +  a0)  ||  zn  -  zn-i  || 

lkn+l-^0||  <  \\zn+l  -  Zn\\  +  \\zn  -  Z0\\ 

<  K-/(2R  +  a0)\\zn  -2n_i||  +  \\zn  -  -0|| 

<  (K^y{2R  +  a0))n_1||-2  -  -i||  +  \\zn  -  20|| 

<  {^Kl  {e  +  a0)(K~/(2R  +  a0))n_1  +  K^e  +  a0)  \^{K^{2R  +  a0)y  +  1  j  e 

K' y(e  +  «o)  \ 


<  U  + 


=  R 


1  -  K^{2R  +  «o), 


y  la  sucesión  {zn}  está  entonces  bien  definida. 

Por  otra  parte,  resulta  evidente  que 

\\zn+i  -  2n||  <  K^{e  +  ao)(Kry(2R  +  ao))n_1, 

y,  como  K^(2R  +  a0 )  <  1,  se  sigue  que  {zn}  es  una  sucesión  de  Cauchy,  y  por  tanto  con¬ 
vergente  a  un  punto  z*  e  B{zq,R).  Veamos  que  z*  es  solución  de  la  ecuación  F(x)  =  0. 
Como 

II  B(zn^  ||  U  ||  Lo  Ln||  ||  Zn  Zn—  1 1| 

A  K  (|| zn  zq 1 1  T  || zn—  i  Z—  1 1 1 )  || zn  zn—  1 1 1 
<  K  {2R  +  a0)||^n  —  2n_i||, 

por  la  continuidad  del  operador  F,  es  fácil  ver  que  F(z*)  =  0,  puesto  que  lím  (|F(zn)||  =  ||F(:r* 
Finalmente,  probamos  la  unicidad  de  la  solución  z*  en  B(zo,  r)fló,  donde  r  =  -A-  —  R— a0. 
Suponemos  entonces  que  tenemos  otra  solución  distinta  y*  E  B(zo,r)  fl  ó  de  F(x)  =  0. 
Consideramos 

F(y *)  -  F(z*)  =  ÍV  F'[u)  du  =  ['  F’(z*  +  t(y*  -  z*))(y *  -  z*)  dt  =  0, 

Jz*  Jo 


=  0. 
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y  el  operador  J  —  F'(z*  +  t(y*  —  z*))  dt.  Teniendo  en  cuenta 

Jo 

|| J -  ¿o 1  J-||  <  IILo-'IIIILo- J|| 

<  Hiñ'll  t  \\F\z'  +  t(y'  -  z'))  -  L„\\dt 
Jo 


<  II L 


o 

—i  i 

o  I 


/ 1  (II^V  +  t(y*  -  z*))  ~  F\z0)W  +  \\F'(z0)  -  LoW)  dt 
Jo 

<7  i"  2K\\z*  +  t{y*  -  z*)  -  zo\\  dt  +  7||F'(zo)  -  L0 1| 

7o 

<7/  2K  ((1  -  t)\\z*  ~  z0\\  +  t\\y*  -  z0\\)  dt  +  K^Uzo  -  z-í\\ 

Jo 


<  K”f(R  +  r  +  «o) 
=  1 


y  el  lema  de  Banach  (lema[L22),  se  sigue  que  J  es  inversible  y,  por  tanto,  y*  =  z*.  Notemos 
que  r  >  R  >  0,  puesto  que  Kj(2R  +  a0)  <  1,  por  cumplirse  (2.11)  (véase  el  lema  2.3).  ■ 


2.2.2.  Accesibilidad 

Si  consideramos  de  nuevo  la  ecuación  compleja  F(z)  =  z3  —  1  =  0  y  observamos  las 
regiones  de  accesibilidad  asociadas  a  la  raíz  z  —  1  para  el  método  simplificado  de  la  secante 


(2.1)  (región  roja)  y  los  métodos  tipo  secante  para  distintos  valores  de  A  (A  =  0  (región 


verde),  A  =  ^  (región  rosa),  A  =  ^  (región  amarilla)  y  A  =  ^  (región  morada))  en  las 
condiciones  indicadas  anteriormente,  vemos  claramente  la  mejora  que  se  consigue  tomando 


distintos  valores  del  parámetro  a0  en  las  figuras  |2.10fj2.17|  Notamos  que  las  regiones  están 
superpuestas. 

Nuestro  siguiente  objetivo  es  comparar  con  mayor  exactitud  los  dominios  de  parámetros 


de  los  métodos  tipo  secante  con  el  del  simplificado  de  la  secante  (2.1).  Para  ello,  tenemos  que 


representar  los  mismos  valores  en  los  ejes  de  los  planos  donde  representamos  gráficamente 
los  dominios  de  los  parámetros.  Para  ello,  tenemos  que  escribir  ¡d  en  función  de  7,  de  manera 
que  podemos  representar  los  valores  de  los  inversos  de  las  mismas  diferencias  divididas.  Así, 


si  L0  1  existe  y  ||L0  ||  <  £,  tenemos 


\I  ~  Lq1  A$\ 


<  ||ió0  1 1|  ||L0- Ao||  <  jK\\y0  —  x_i||  <'yKXa 


y,  siempre  que  'jKXa  <  1, 


II  Vil  < 


7 


1  —  7/1  Xa 


=  fd. 


Como  se  puede  observar  en  la  figura  2.18  el  dominio  de  parámetros  del  método  simpli¬ 


ficado  de  la  secante  (2.1)  resuelve  el  problema  que  tenían  los  métodos  tipo  secante  cuando 


los  valores  de  a0  o  e  son  pequeños.  Fijado  un  valor  de  A"7«o  perteneciente  al  dominio  de 
parámetros,  observamos  que  el  valor  de  K^e  solo  está  acotado  superiormente  (no  inferior- 


mente).  Por  ello,  en  las  regiones  de  accesibilidad  del  método  simplificado  de  la  secante  (2.1) 
no  aparecen  zonas  huecas  conteniendo  a  la  raíz,  tal  y  como  ocurre  para  los  métodos  tipo 
secante.  Notamos  que  las  regiones  están  superpuestas. 


Figura  2.10:  Regiones  de  accesibilidad  de  la 
raíz  z  =  1  de  la  ecuación  F(z)  =  —  1  =  0 

para  el  método  simplificado  de  la  secante 
(región  roja)  y  el  método  tipo  secante  co¬ 
rrespondiente  a  A  =  0  (región  verde)  y  to¬ 
mando  a  —  |. 


Figura  2.11:  Regiones  de  accesibilidad  de  la 
raíz  z  =  1  de  la  ecuación  F(z)  =  z3  —  1  =  0 
para  el  método  simplificado  de  la  secante 
(región  roja)  y  el  método  tipo  secante  co¬ 
rrespondiente  a  A  =  I  (región  morada)  y 
tomando  a  = 


2.3.  Método  iterativo  híbrido  (predictor-corrector) 


A  partir  de  lo  visto  anteriormente,  el  objetivo  principal  es  ahora  construir,  apoyándonos 


en  el  método  simplificado  de  la  secante  (2.1),  una  modificación  de  los  métodos  tipo  secante 


que  mejore  su  dominio  de  parámetros  y  su  región  de  accesibilidad. 


2.3.1.  Construcción  del  método 


Como  se  observa  en  la  figura  2.18  el  dominio  de  parámetros  del  método  simplificado  de 


la  secante  (2.1)  no  tiene  los  problemas  de  accesibilidad  de  los  dominios  de  parámetros  de  los 


métodos  tipo  secante.  Trataremos  entonces  de  asegurar  que,  para  una  terna  inicial  (a0,7,  e) 


que  satisfaga  las  condiciones  dadas  en  (2.11)  y  estar  así  en  el  dominio  de  parámetros  del 


método  simplificado  de  la  secante  (2.1),  podamos  obtener  una  terna  (a,  (3,7])  que  satisfaga 


las  condiciones  dadas  en  (2.5)  después  de  realizar  un  cierto  número  de  iteraciones  N0  con 


el  método  simplificado  de  la  secante  (2.1),  de  manera  que  estemos  en  condiciones  de  poder 


garantizar  la  convergencia  de  la  familia  de  métodos  tipo  secante.  Cuando  esto  ocurra,  podre¬ 
mos  considerar  la  terna  {o¿n0,  ^n0,Vn0)  como  terna  inicial  (a,  (3,7])  de  la  familia  de  métodos 
tipo  secante. 

Nuestro  objetivo  inmediato  es  entonces  construir  una  sencilla  modificación  de  la  familia 
de  métodos  tipo  secante  que  sea  convergente  al  empezar  en  los  mismos  puntos  de  salida  que 


garantizan  la  convergencia  del  método  simplificado  de  la  secante  (2.1).  Así,  consideramos  el 
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Figura  2.12:  Regiones  de  accesibilidad  de  la 
raíz  z  =  1  de  la  ecuación  F(z)  =  z3  —  1  =  0 
para  el  método  simplificado  de  la  secante 
(región  roja)  y  el  método  tipo  secante  co¬ 
rrespondiente  a  A  =  0  (región  verde)  y  to¬ 
mando  a  —  ’  . 


Figura  2.13:  Regiones  de  accesibilidad  de  la 
raíz  z  —  1  de  la  ecuación  F(z)  =  z3  —  1  =  0 
para  el  método  simplificado  de  la  secante 
(región  roja)  y  el  método  tipo  secante  co¬ 
rrespondiente  a  1  =  j  (región  morada)  y 
tomando  a  =  A 


método  iterativo  híbrido  (predictor-corrector)  dado  por 


í  dados  Z-i,  z0  en  Í2, 

\  zi+l  =  Zi-  [zo,  z_i;  F]-lF{zi),  i  =  0, 1, . . . ,  N0  -  1, 

<  (2.14) 

(  X-1  =  Zn0-  1,Xo  =  Zn0, 

^  \  xn+i  =  xn  -  [Xxn  + (1  -  X)xn-1,xn-,F]~1F(xn),  Ae  [0,1),  n  >  0, 


donde  z_i  y  z0  satisfacen  (2.11),  mientras  que  x_\  =  zjv0-i  Y  x o  =  zn0  satisfacen  (2.5).  Para 
que  el  método  híbrido  (2.14)  sea  convergente,  nos  planteamos  dos  cuestiones: 


1.  Localizar  Z-\  y  z0  de  manera  que  el  método  predictor,  el  método  simplificado  de  la 
secante  (2.1),  sea  convergente. 


2.  Utilizando  la  convergencia  del  método  predictor,  calcular  un  valor  N0  tal  que  Zn0~i  y 
Zn0  sean  considerados  puntos  iniciales  a  partir  de  los  cuales  la  convergencia  del  método 
corrector,  la  familia  de  métodos  tipo  secante  para  un  valor  fijo  de  A,  esté  garantizada. 


Así,  utilizamos  el  método  simplificado  de  la  secante  (2.1)  durante  un  número  finito  de 
pasos  N0  hasta  que  zn0-i  =  x~i  Y  zn0  =  R)  cumplan  las  condiciones  dadas  en  (2.5)  y,  después, 
aplicaremos  un  método  de  la  familia  de  métodos  tipo  secante  en  vez  del  método  simplificado 
de  la  secante  (2.1).  La  clave  del  problema  está  entonces  en  garantizar  la  existencia  de  N0. 
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Figura  2.14:  Regiones  de  accesibilidad  de  la 
raíz  z  =  1  de  la  ecuación  F(z)  =  —  1  =  0 

para  el  método  simplificado  de  la  secante 
(región  roja)  y  el  método  tipo  secante  co¬ 
rrespondiente  a  A  =  0  (región  verde)  y  to¬ 
mando  a  —  ' 


Figura  2.15:  Regiones  de  accesibilidad  de  la 
raíz  z  =  1  de  la  ecuación  F(z)  =  z3  —  1  =  0 
para  el  método  simplificado  de  la  secante 
(región  roja)  y  el  método  tipo  secante  co¬ 
rrespondiente  a  A  =  |  (región  rosa)  y  to¬ 
mando  a  —  . 


2.3.2.  Convergencia  semilocal  del  método 


A  continuación,  vamos  a  estudiar  la  convergencia  semilocal  del  método  (2.14).  A  partir 


del  método  predictor,  consideramos  la  siguiente  situación.  Dadas  las  aproximaciones  iniciales 
Z-\  y  Zq,  consideramos  la  sucesión  { zn }  definida  por  el  método  simplificado  de  la  secante 


(2.1)  y  denotamos  M  =  Ky(2R  +  a0)-  Para  que  el  método  simplificado  de  la  secante  (2.1) 


sea  convergente,  sabemos  que  la  terna  inicial  (a0;  7,  £)  debe  verificar  las  condiciones  dadas  en 


(2.11).  Nos  planteamos  ahora  cómo  encontrar  N0  de  manera  que,  a  partir  de  la  iteración  N0 


del  método  simplificado  de  la  secante  (2.1),  podamos  considerar  la  familia  de  métodos  tipo 


secante  con  X-\  =  £jv0_i  y  xq  =  z^0  cumpliendo  (2.5). 

En  primer  lugar,  observamos  que  la  definición  de  la  terna  inicial  (a0)  An  7o)  para  la  familia 
de  métodos  tipo  secante  es  inmediata  sin  más  que  tener  en  cuenta  /30  = 
puesto  que 


7 


1  —  M 


y  7o  =  e, 


| /  —  Lq  ^ Aq ||  7  || Lq  i  ||  || Lq  —  Aq ||  7  yI\.\oiQ  <  yli-Ct o  7  M  <C  1. 

A  continuación,  vamos  iterando  para  definir  las  ternas  (an,  (3n,r]n)  asociadas  a  cada  zn.  Para 
ello,  procedemos  de  la  siguiente  forma. 


Primer  paso  del  método  predictor:  definición  de  la  terna  (aq,  /31;  r¡i). 
Como 

Iki  -  2o||  =  ll¿o_1^o)||  <£  =  Vo  =  OL 1, 
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Figura  2.16:  Regiones  de  accesibilidad  de  la 
raíz  z  =  1  de  la  ecuación  F(z)  =  z3  —  1  =  0 
para  el  método  simplificado  de  la  secante 
(región  roja)  y  el  método  tipo  secante  co¬ 
rrespondiente  a  A  =  0  (región  verde)  y  to¬ 
mando  a  —  . 


Figura  2.17:  Regiones  de  accesibilidad  de  la 
raíz  z  —  1  de  la  ecuación  F(z)  =  z3  —  1  =  0 
para  el  método  simplificado  de  la  secante 
(región  roja)  y  el  método  tipo  secante  co¬ 
rrespondiente  a  A  =  0  y  tomando  a  =  A 


1  -  L¿'A, 


<  'yK  (||Azi  +  (1  —  A)^o  ~~  z-i\\  +  \\zi  ~  ¿olí) 

<  7 K  ((1  +  A)  \\z!  -  s0||  +  \\z0  -  ^-1 1|) 

<  'yK  ((1  +  X)R  +  a0) 

<  M, 


HA  1\\  —  llt'A  +  (i  —  ^)2o,  ¿i,  f]  x||  <  yitjj  ~ 


IIAAII  <  \\Li  —  L0\\  \\zi  —  £0|| 

<  K  (||^o  -  Z—1 1|  +  Iki  -  20||)  Ikl  -  2o|| 

<  K(a0  +  £)\\zx-  z0\\, 

\\z2  -  zi ||  <  IIÉq1!!  ||-F(2i)||  <  jK(a0  +  e)r]0  <  'yK (2R  +  a0)r]0  =  Mrj0  =  tr, 
siempre  que  M  <  1.  Además,  rji  =  Mr¡0  <  r)0  si  M  <  1. 


Segundo  paso  del  método  predictor:  definición  de  la  terna  («2,  A,  Vz)- 
Como 


z2  ~  z\ ||  =  ||F01F(zi)||  <  || Av0  1 1|  ||F(zi)||  <  7/í(a0  +  e)ij0  <7 1  =  a2, 
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1.0 
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0.2 


0.00  0.05  0.10  0.15  0.20 


Figura  2.18:  Dominios  de  parámetros  del  método  simplificado  de  la  secante  (2.1)  asociado 
al  teorema  2.5  (región  roja)  y  de  los  métodos  tipo  secante  asociados  al  teorema  2.2  cuando 
A  =  0,  |,  |  (regiones  verde,  rosa,  amarilla  y  morada,  respectivamente). 


\\I-L^A2\\  < 
< 
< 
< 


\\L0  1 1|  || L0  —  A2 1| 

ryR  (|| A^2  +  (1  —  A)zi  —  z_i||  +  ||^2  —  2o||) 

yA  ((1  +  A) || ^2  —  zo\\  +  (1  —  A)||^i  —  zo||  +  ll^o  —  2_i||) 

y  A  (2 R  +  oíq) 


=  M, 


HA'1 


[A^2  +  (1  —  A)^i,  z\\ F]  1 


< 


7 

1  —  M 


&2, 


||-^(^2)||  <  \\L2  ~  Lq\\  \\z2  —  2l|| 

<  K  (||^1  -  Z-1 1|  +  ||z2  -  20||)  11^2  -  2i|| 

<  A  (2 R  +  «o)  \\z2  —  2i||, 

11^3  -  22 1|  <  ll^ol  11^(22)11  <  yA'(2A  +  ao)||2:2  -  21 II  <  Mr)i  =  r¡2, 

siempre  que  M  <  1.  Además,  a2  =  r]\  =  Mrjo  =  Moi\  <  ot\  y  rj2  =  Mr]  1  =  M2i]0  <  y0  si 
M  <  1. 


n-ésimo  paso  del  método  predictor:  definición  de  la  terna  (cen,  /3n,r]n). 
Como 

||2n  —  2n_i||  =  ||Aó1A(^n_i)||  <  HAó1!!  ||A(zn_i)|| 

<  yA'(2A  +  a0)||2n-i  -  2n_2|| 

<  yA'(2A  +  a0)r]n_2 

=  Mr]n-2  =  yn_i  =  an, 


2.3.  MÉTODO  ITERATIVO  HÍBRIDO  (PREDICTOR-CORRECTOR) 
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1 1  Lq  An\\  <  ||Zvq  ||  \\Lq  ^4n|| 

<  7 K  (||Azn  +  (1  -  A)zn_i  -  z_i||  +  || zn  -  *o||) 

<  7 K  ((1  +  A)||zn  -  ||  +  (1  -  A)||^n_i  -  ^o||  +  Iko  -  z~í\ 

<  r]K{2R  +  oto) 

=  M, 


\\An  1  =  [Xzn  +  (1  -  X)zn-Uzn-F\ 


-i 


< 


7 


1  -M 


finí 


||-F(Zn)||  <  \\Ln- Lo\\\\zn- Zn-i\\ 

<  K  (||zn_i  -  Z_i||  +  ||zn  -  Z0||)  ||*n  “  ^n-l|| 

7  R  (2 R  T  C^o)  ||-^n  Zn—  1 1|  i 

||^n+l  ^n||  A  HA,  II  ll'^1('^n)ll  —  7 77(27?  -f-  C^o)||^n  Zn— 1||  A  t\R^jn—  1  Vni 

siempre  que  M  <  1.  Además,  an  =  r/n_i  =  Mn~lr)o  =  Mn~1aí  <  a,  y  r¡n  =  Mr¡n- ,  = 
Mnr¡o  <  t)q  si  M  <  1. 


Una  vez  construida  la  terna  (an,  fin,  rjn),  formada  a  partir  de  las  sucesiones  reales  {an}, 
{fin}  y  {f/n},  buscamos  un  valor  Nq  G  N,  de  manera  que  la  terna  (a/v0,  fiN0,  Vn0)  verifique  las 
condiciones  de  convergencia  dadas  en  (2.5)  para  la  familia  de  métodos  tipo  secante. 

En  primer  lugar,  consideramos  la  correspondiente  primera  condición  de  (2.5): 

V5 


Vn0 


< 


aN0  +  Vn0  2 

Como  rjn  =  Mrjn-i  y  otn  =  r/n_ ,,  la  condición  anterior  se  transforma  en 


M 


1  +  M 


< 


3  — 


M  < 


Vfi-i 


Debido  al  tipo  de  sucesiones  que  hemos  definido  y  las  cotas  que  hemos  utilizado,  observamos 
que  el  cálculo  de  nuevas  iteraciones  con  el  método  predictor  no  permite  verificar  la  condición 
a  partir  de  un  n,  luego  esta  condición  tendremos  que  imponerla  inicialmente.  Notemos  que 
esta  condición  no  representa  una  restricción  excesiva. 

En  segundo  lugar,  la  correspondiente  segunda  condición  de  (2.5)  se  transforma  en 

Vn0 


K¡ 3  n0  < 


( OI  N0  +  VN0)(aN0  +  Vn0  —  KaNo  —  Vn0)) 


Luego, 

K'y 


< 


Mr)  jv0-i 


M 


1  —  M  (1  +  M)r)N0-i{fi  +  M  —  A(1  —  M))rjN0_i  (1  +  M)(  1  +  M  —  A(1  —  M))r)N0-i 
de  manera  que 

M  (1  -  M) 


(1  +  M)(l  +  M  —  A(1  —  M))  ’ 


^7hVo-i  < 
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Así 


MN°-'KTri0  < 


M{  1  -  M) 


(1  +  M)(1  +  iíí-  A(1  -  Af)) 
y  teniendo  en  cuenta  M  <  1  y  rj0  =  e,  escribimos 


N0  >  1  + 


lQg  ((1+M)a+M-Í(l-M)))  -  lQg  (A>) 


logilí 


En  consecuencia,  una  vez  fijado  A  G  [0, 1)  y  denotado  la  parte  entera  del  número  real  t  por 
[t],  tomamos 

lo§  ((i+m)U+mMa(i-m)))  -  loS  (Kle) 


N0  =  l  + 


1  + 


(2.15) 


log  M 

y  ya  podemos  asegurar  que  los  métodos  tipo  secante  convergen  cuando  parten  de  los  puntos 


X-x  =  zn0_i  y  x0  =  zn0,  donde  N0  está  definido  en  (2.15). 

Finalmente,  una  vez  estimado  a  priori  el  valor  de  No,  resumimos  todo  lo  anterior  en  el 
siguiente  resultado. 

Teorema  2.6.  Sean  X  e  Y  dos  espacios  de  Banach  y  F  :  ó  C  X  — >■  Y  un  operador  definido 
en  un  conjunto  abierto  convexo  no  vacío  ó.  Supongamos  que  se  cumplen  las  condiciones 
(Hí)-(Hf)  y  (2.11).  Si  B(zq,R)  C  ó,  con  R  dado  en  (2.13),  y  M  =  K^(2R  +  ct0)  <  ^':>f 1 , 


entonces  la  sucesión  dada  por  el  método  híbrido  (2.14 


está  bien  definida  y  converge  a  una 


solución  de  la  ecuación  F(x)  =  0,  donde  N0  está  definido  en  (2.15). 


2.4.  Aplicación 

Hemos  justificado  anteriormente  que  la  aplicación  de  los  métodos  tipo  secante  es  más 


Consideramos  la  siguiente  ecuación  integral  no  lineal  de  tipo  Hammerstein 


restrictiva  que  la  del  método  simplificado  de  la  secante  (2.1).  Ilustrémoslo  con  un  ejemplo. 

(2.16) 


íc(s)  =  1  H —  /  G(s,  t )  x(t )2  dt,  s  G  [0, 1], 

2  Jo 


donde  x  G  C[ 0, 1],  t  G  [0, 1]  y  G  es  la  función  de  Green  en  [0, 1]  x  [0, 1]. 

A  continuación,  transformamos  la  ecuación  integral  ( 2 . 1 6 [)  en  un  problema  de  dimensión 
finita,  tal  y  como  se  hizo  en  la  sección  1.6.1  del  capítulo  [lj  de  manera  que  obtenemos  el 
siguiente  sistema  de  ecuaciones  no  lineales: 


F(x)  =  x-  1  —  -A  ü  =  0,  F  : 


(2.17) 


donde 

X  =  (xi,x2,  ■  ■  ■,Xs)T, 
Además, 


1  =  (1,1,  •••,!)  ,  A=(a>ij)ij= n  x  =  (x1,x2,...,a;8) 


[u, v;  F]  =  I  -  -Adiag{z}, 


2 \T 


donde  z  =  (zi,  z2,  ■  ■  ■ ,  z$)T  y  para  todo  i  =  1,  2, . . . ,  8. 


2.4.  APLICACIÓN 
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Eligiendo  z_i  =  (9/10, 9/10, ...,  9/10)T  y  z0  =  (1, 1, . . . ,  1)T  como  puntos  de  salida  y 
la  norma  del  máximo,  obtenemos  «o  =  0.1,  7  =  1.1305  ...,£  =  0.0687. . .,  K  =  0.0617. . ., 
K'yao  =  0.0069...  y  K'ye  =  0.0047...  Por  tanto,  se  puede  ver  que  se  verifican  las  dos 


condiciones  de  (2.11)  y  podemos  aplicar  entonces  el  método  simplificado  de  la  secante  (2.1) 


tipo  secante,  ya  que  la  primera  condición  de  (2.5)  no  se  satisface,  puesto  que 


para  aproximar  una  solución  del  sistema  (2.17).  Por  contra,  no  podemos  utilizar  los  métodos 


V 


a  +  rj 


=  0.4072 


>  — —  0.3819 


donde  a  —  a¿o  y  rj  —  e. 


Por  el  teorema  2.5 


el  método  simplificado  de  la  secante  (2.1 )  es  convergente  y,  después  de 
ocho  iteraciones  y  usando  el  criterio  de  parada  ||zn  —  zn_i||  <  10-16,  obtenemos  la  aproxima- 

En 


cion  numérica  x  =  leí, x 


i;  ^21 


Xg)T  de  la  solución  de  (2.17)  que  vemos  en  la  tabla  2.1 


la  tabla  2.2  mostramos  los  errores  ||zn  —  x*||  obtenidos  usando  el  mismo  criterio  de  parada. 
Notemos  que  el  vector  dado  en  la  tabla  2.1  es  una  buena  aproximación  de  la  solución  del 
sistema  (2.17),  puesto  que  ||F(x*)||  <  constante  x  1CT16.  Mostramos  la  sucesión  {||F(zn)||} 


en  la  tabla  12.21 


i 

x* 

i 

x* 

i 

x* 

i 

x* 

1 

1.005450 . . . 

3 

1.051629... 

5 

1.069365... 

7 

1.025815... 

2 

1.025815... 

4 

1.069365... 

6 

1.051629... 

8 

1.005450... 

Tabla  2.1:  Aproximación  de  la  solución  x*  de  (2.17) 


n 

||zn 

-x*|| 

II  F(z 

n)  || 

-1 

1.6936. 

..  x  10”1 

1.5004... 

x  10-1 

0 

6.9365. 

. .  x  10“2 

6.1779... 

x  10~2 

1 

6.6461 . 

. .  x  10"4 

5.9142. . 

x  10~4 

2 

8.6314. 

. .  x  10“6 

7.6848 . . 

x  10~6 

3 

1.1194. 

..  x  10“7 

9.9676 . . 

x  10~8 

4 

1.4513. 

. .  x  10“9 

1.2922. . 

x  10~9 

5 

1.8814. 

. .  x  10-11 

1.6752... 

x  10"11 

6 

2.4390 . 

. .  x  10~13 

2.1717. . . 

x  10"13 

7 

3.1619. 

. .  x  10~15 

2.8154. . . 

x  10"15 

Tabla  2.2:  Errores  absolutos  obtenidos  con  el  método  simplificado  de  la  secante  y  {||F(zn)||} 


Además,  por  el  teorema  2.5  la  existencia  de  la  solución  está  garantizada  enfi(z0, 1.1683  . . .) 


y  es  única  en  B( z0, 13.0286  . . .). 

Ahora,  vamos  a  aplicar  el  método  híbrido  (2.14)  con  A  =  ^  para  aproximar  la  solución 
de  (2.17)  dada  en  la  tabla  2.1  Para  esto,  teniendo  en  cuenta  que  M  =  K^(2R  +  qp)  = 

calculamos  el  valor  Nq  determinado  por  el  teorema 


0.0166...  <  0.6180...  = 


_  v/5 ~ 

2, 


2.6 


De 


acuerdo  con  la  fórmula  (2.15),  N0  =  1  para  A  =  por  tanto,  después  de  una  iteración  del 


76 


CAPÍTULO  2.  SITUACIÓN  DIFEREN CIABLE 


método  simplificado  de  la  secante  (2.1),  aplicamos  el  método  tipo  secante  correspondiente  a 
A  =  ^  y  obtenemos  la  solución  aproximada  dada  en  la  tabla  2.1  después  de  tres  iteraciones 
más.  En  la  tabla  2.3  se  pueden  ver  los  errores  ||xn— x* 

10  16,  así  como  la  sucesión  {||F(xr 


con  el  criterio  de  parada 


x„ -x, 


< 


n 

llXn 

-  x1l 

||F(X 

n)  || 

-1 

1.6936. 

..  x  10”1 

1.5004... 

x  10“4 

0 

6.9365. 

. .  x  10-2 

6.1779... 

x  10"2 

1 

6.6461 . 

. .  x  10”4 

5.9142. . . 

x  10-4 

2 

1.5148. 

.  x  10"1U 

1.3499. . . 

x  10~1U 

3 

2.6106. 

.  x  10"15 

2.3266. . . 

x  10"15 

Tabla  2.3:  Errores  absolutos  obtenidos  con  el  método  híbrido  (2.14)  correspondiente  a  A 

y{||^(x„)||} 


1 

2 


Capítulo  3 

Situación  (no)-diferenciable 


En  este  capítulo,  vamos  a  estudiar  la  convergencia  semilocal  de  los  métodos  tipo  secante 
persiguiendo  dos  objetivos.  En  primer  lugar,  a  partir  de  una  modificación  de  la  técnica  de 
demostración  dada  por  las  relaciones  de  recurrencia  en  el  teorema  2Ó2  del  capítulo  anterior, 
obtenemos  un  resultado  de  convergencia  semilocal  para  la  familia  de  métodos  tipo  secante  que 
mejora  notablemente  el  dominio  de  parámetros  asociado  al  teorema  2.2  Además,  el  resultado 
así  obtenido  proporciona  un  resultado  nuevo  de  convergencia  semilocal  cuando  el  operador 
implicado  F  es  no  difcrenciable,  situación  habitualmente  no  contemplada  y  que  se  deduce 
gracias  a  la  novedosa  condición  que  se  exige  a  la  diferencia  dividida  de  primer  orden  de  F. 

En  la  sección  3H  recordamos  el  principal  problema  que  presenta  el  estudio  de  la  conver¬ 
gencia  semilocal  dado  para  la  familia  de  métodos  tipo  secante  en  el  capítulo  anterior,  que, 
tal  y  como  hemos  visto,  es  que  limita  mucho  la  aplicación  de  estos  métodos  para  resolver 
F(x)  =  0.  Además,  presentamos  la  novedosa  condición  que  exigiremos  a  la  diferencia  dividida 
de  primer  orden  de  F.  En  la  sección  322  vemos  que  el  dominio  de  parámetros  de  la  familia  de 
métodos  tipo  secante  se  puede  mejorar  utilizando  una  modificación  de  la  técnica  de  demos¬ 
tración  de  la  convergencia  semilocal  presentada,  que,  además,  como  hemos  dicho  antes,  va  a 
permitir  contemplar  situaciones  en  las  que  el  operador  F  es  uo  diferenciable.  Finalmente,  en 
la  sección  3A  ilustramos  lo  anterior  con  dos  sistemas  no  lineales,  uno  diferenciable  y  otro  no 
diferenciable. 


3.1.  Planteamiento  del  problema 


Hemos  visto  en  el  capítulo  anterior,  teorema  |2.2[  un  resultado  de  convergencia  semilocal 
bajo  la  exigencia  de  que  exista  la  diferencia  dividida  de  primer  orden  del  operador  F  para 
cada  par  de  puntos  distintos  en  Í2  y  de  que  se  cumplan  las  siguientes  condiciones  iniciales: 

(Cl)  || £0  —  £-i||  =  «^0  con  X-i,Xq  G  Í2, 

(C2)  fijado  A  G  [0,1),  existe  Aq1  =  [y0,  xo]  F]  L  G  C(Y,X),  para  xo,yo  G  Í2,  y  es 
tal  que  ||  II  <  P, 

(C3)  ||[2/0,£0;F]“1F(a;o)||  <  y, 

(C4)  \\[x,y,F]-[u,v,F]\\  <  K(\\x-u\\  +  \\y-v\\),  K  >  0,  x,  y,  u,  v  G  Í2,  x^y, 
u  7^  V. 


Se  obtienen  entonces  condiciones  suficientes  para  que  se  dé  la  convergencia  semilocal  de 
la  familia  de  métodos  tipo  secante,  tal  y  como  hemos  visto  en  el  teorema  2.2  del  capítulo 
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anterior.  Este  resultado  requiere  que  el  operador  F  sea  diferenciadle,  además  de  tener  asociado 
un  dominio  de  parámetros  reducido  y,  junto  con  los  inconvenientes  descritos  en  el  capítulo 
anterior,  implica  una  deficiente  aplicabilidad  de  los  métodos  tipo  secante. 


Si  consideramos  ecuaciones  integrales  no  lineales  de  tipo  Hammerstein  de  la  forma  (1.41 ), 


presentadas  en  la  sección  1.6.1 ,  donde 


H(t,  x(t))  =  Sx(t)2  +  n\x(t)\,  5,/jíEM., 

y  las  trasformamos,  mediante  un  proceso  de  discretización,  en  sistemas  de  ecuaciones  no 
lineales  de  la  forma 

$(x)=x-f-A(¿x  +  /ix)  =  0,  Ü/  :  — »  Mm,  (3.1) 

donde  x  =  (xf,  x%,  . . . ,  x2n)T,  x  =  (|xi|,  [x2|,  •  ■ . ,  \xm\)T  y  5,/i  6  K,  es  obvio  que  la  función 


definida  en  (3.1)  es  no  lineal  y  además  no  diferenciable  si  /i  7^  0.  Teniendo  en  cuenta  (1.46), 
consideramos 

[u,  v;  \Ü]  =  I  -  A  (Miagjz)  +  /idiagjw}), 

donde  z  =  (zi,  Z2,  ■  ■  ■ ,  zm)T  con  Zi  =  Uí+Ví,  para  todo  i  —  1,  2, . . . ,  m,  y  w  =  (tci,  tc2, . . . ,  wm)T 
con  Wi  =  para  todo  i  —  1,  2, . . . ,  m,  de  manera  que 

Ui  Vi 

II [x, y;  T]  -  [u,v;T]||  <  L  +  K (||x  -  u||  +  ||y-v||)  con  L  —  2|/z|  \\A\\  y  K  =  |<S|  \\A\\.  (3.2) 
Por  tanto,  si  en  vez  de  exigir  la  condición  (C4)  para  la  diferencia  dividida  de  primer  orden 


del  operador  F,  exigimos  que  F  cumpla  una  condición  del  tipo  (3.2)  en  el  espacio  de  Banach 
X,  la  dada  por 

\\[x,y;F]-[u,v;F]\\  <  L  +  K(\\x  —  u\\  +  \\y  —  v\\);L,K  >  0;  x,  y,  u,  v  e  O;  x  ±  y-  u  ±  v,  (3.3) 
podremos  considerar  situaciones  en  las  que  el  operador  F  sea  no  diferenciable  (L  ^  0),  como 


por  ejemplo  la  indicada  anteriormente  para  la  función  T  definida  en  (3.1)  con  /i  7^  ().  Por  el 


contrario,  para  L  —  0,  podemos  seguir  considerando  situaciones  en  las  que  el  operador  F  sea 


diferenciable,  lo  que  se  contempla  en  (3.3)  si  /i  =  0 


Así,  para  el  caso  anterior,  vamos  a  obtener  un  nuevo  resultado  de  convergencia  semilocal 


exigiendo  la  condición  (3.3)  al  operador  F,  resultado  que  para  L  —  0  permitirá  mejorar  los 


dominios  de  parámetros  asociados  al  teorema  |2.2|  para  los  métodos  tipo  secante  cuando  el 
operador  F  sea  diferenciable,  mientras  que  para  L  7^  0  permitirá  obtener  un  resultado  de 
convergencia  semilocal  en  situaciones  en  las  que  el  operador  F  sea  no  diferenciable. 


3.2.  Mejora  de  la  accesibilidad 

Nuestro  primer  objetivo  es  entonces  ampliar  el  dominio  de  parámetros  de  los  métodos  tipo 
secante.  Para  ello  desarrollamos  una  nueva  técnica  para  analizar  la  convergencia  semilocal  de 
estos  métodos,  que  además,  como  segundo  objetivo,  va  a  permitir  utilizar  los  métodos  tipo 
secante  para  resolver  ecuaciones  en  situaciones  en  las  que  el  operador  F  sea  no  diferenciable. 


Como  en  el  teorema  2.2,  exigiremos  que  exista  una  diferencia  dividida  de  primer  orden  del 


operador  F  para  cada  par  de  puntos  distintos  de  ó. 

Por  otra  parte,  si  la  sucesión  {xn}  está  generada  por  los  métodos  tipo  secante,  resulta 
evidente  en  el  estudio  de  su  convergencia  que  existirán  todas  las  diferencias  divididas  de 
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primer  orden  [y/.,  x¡~ ;  F],  salvo  que  xy.  =  yk  =  A Xk  +  (1  —  \)xk-i1  en  cuyo  caso  resulta  evidente 
que  Xk  =  Xk- 1  y,  por  tanto,  Xk-i  =  Xk  =  x*  es  una  solución  de  la  ecuación  F(i)  =  0  y 
xn  =  x*,  para  todo  n  >  k  —  1,  de  manera  que  la  sucesión  {xn}  es  convergente  a  la  solución 
x*  de  F(x)  =  0. 

Teniendo  en  cuenta  estas  ideas,  comenzamos  dando  un  lema  técnico  que  utilizamos  pos¬ 
teriormente. 


Lema  3.1.  Sea  {xn}  la  sucesión  dada  por  los  métodos  tipo  secante.  Si  xm_i  xrn  con 
Xm—h  xm  £  O ,  entonces 

F(xm)  ( [^m,  xm—i ,  F)  Am_x)  {xm  xm— i),  donde  Am_\  (ym_\,  xm—\,  A1]- 

Demostración.  A  partir  de  la  definición  de  la  sucesión  {xn}  se  sigue 

FipXm)  T  \ym—  1)  Xm—  i,  F)  (xm  Xm—\)  0, 


de  manera  que 

F(xr 


F(xm)  F(xm—  i)  [l/m—  1 ,  Xm—  { ,  A]  (xm  Xm—i) 

\Xm j  X m—  i ,  F)  (xm  Xm—\)  [z/m—  1 ,  Xm—  ] ,  A]  {xm  l) 

( [Xm  i  Xm—  1 ,  F ]  Am_  x  )  ( Xm  Xm—  x  )  ■  ® 


A  continuación,  presentamos  el  nuevo  resultado  de  convergencia  semilocal  para  los  méto¬ 
dos  tipo  secante. 

Teorema  3.2.  Sean  X  e  Y  dos  espacios  de  Banach  y  F  :  C  X  — >■  Y  un  operador  no 

lineal  definido  en  un  dominio  abierto  convexo  no  vacío  ó.  Supongamos  que  se  cumplen  las 


condiciones  (C1)-(C3)  y  (3.3).  Fijado  A  €  [0,1),  si  la  ecuación 


h(t )  —ti  1  — 


m 


~r¡  =  0, 


(3.4) 


1  -P(L  +  K(2t  +  (1  -  A)a)) 
donde  m  =  máx  { /3(L  +  K((  1  —  A)a  +  rj)),  ¡3(L  +  (2  —  \)Kr¡)  },  tiene  al  menos  una  raíz  po¬ 


sitiva,  y  denotamos  por  R  la  raíz  positiva  más  pequeña  de  (3.4) 

fi(L  +  K(2R  +  (1  -  A)a))  <  1 


(3.5) 


y  B(xo,R)  C  O ,  entonces  la  sucesión  {xn}  dada  por  los  métodos  tipo  secante,  empezando  en 
X-i  y  xq,  está  bien  definida  y  converge  a  una  solución  x*  de  F(x)  =  0.  Además,  la  solución 
x*  y  las  iteraciones  xn  pertenecen  a  B(x0,  R)  y  x*  es  única  en  B(x0,  R)  fl  ó. 


Demostración.  Comenzamos  probando  que  la  sucesión  {xn}  está  bien  definida,  es  decir, 
xn  £  B(xq,R )  C  ó,  para  todo  n  £  N.  A  partir  de  (C3)  se  sigue  que  X\  está  bien  definido  y 
||xi  —  x0||  =  ||Aó1F(a;o)||  <  rj  <  R,  por  ser  R  solución  de  (3.4).  Luego,  X\  £  B(xq,R). 

A  continuación,  utilizando  (3.3),  vemos  que 


I-A^A,  ||  <  ||Aq  1||  ||A0  —  Ax|| 

<  fi{L  +  K(\\yi  —  y0\\  +  ||xx  —  x0||)) 

<  / 3(L  +  K((  1  +  A)||xx  -  x0||  +  (1  -  A)||x0  -  x_i||)) 

<  ¡3(L  +  K((l  +  X)R  +  (1  —  A)ct)) 

<  ¡3(L  +  K(2R  +  (1  —  A)a)) 


<  1, 


80 


CAPÍTULO  3.  SITUACIÓN  (NO)-DIFERENCIABLE 


y  por  el  lema  de  Banach  (lema  1.22),  tenemos  que  existe  A1  y  es  tal  que 


Pr1!!  < 


P 


l-P(L  +  K(2R+(l-\)á)) 


Además,  por  el  lema  3.1,  se  sigue  F(x i)  =  ([xi,xo;  A]  —  A0)  (xi  —  xo),  de  manera  que 

Il-F(*i)||  <  J|[xi,x0;F]  -  Aq\\  ||xi  -  x0|| 

<  {L  +  K\\y0  -  xi||)||xi  -  ar0 1| 

<  (L  +  K(\\y0  -  x0||  +  ||xi  -  x0||))||xi  -  x0|| 

<  (L  + K((l  -  X)a  +  r)))\\xi- x0\\. 


En  consecuencia, 


11*2  -*iii  <  Pr1llll^i)ll 

<  P(L  +  K  ((1  —  A)q  +  r¡)) 

~  l-P(L  +  K{2R+{l-\)a)) 

<  PWXi-XoW 


\Xi  -  x0 


<  V: 


donde  P  = 


m 


1-P{L  +  K(2R+(1  -  A )a)) 


<  i,  y 


1  —  P 2  T¡ 

\X2  -  Xo\\  <  |F2  -  Xi\\  +  ||xi  -  x0||  <  (1  +  P)  ||xi  -  x0||  =  ||xi  -  X0||  <  =  R. 


Por  lo  tanto,  x2  G  B{xq,  R). 

Ahora,  podemos  demostrar  por  inducción  matemática  sobre  n  que  se  cumplen  los  siguien¬ 
tes  tres  ítems  para  n  G  N: 

•  El  operador  exrete  y  es  tal  que  t  _  p(L  +  K£R  +  (1  _  A)a))  ■ 

•  \\xn  -  xn_i||  <  P  ||xn_i  -  xn_2\\  <  Pn~l  ||a?i  -  x0||  <  rj, 

1  —  Pn+1 

■  ||xn+i  -  x0||  <  p  lFi  -  xo||  <  p  =  R, 

siempre  que  A¿  =  [y¿,  x¿;  F]  sea  inversible  y  x¿+i  G  B{xq,  R),\/i  —  1,2, ...  ,n  —  2. 

En  primer  lugar,  por  hipótesis,  vemos  que 


\I-A^Ar 


< 

1  o 

e 

1 

o 

< 

P(L 

+  K(\\yn-y0\\  +  | 

\xn  ■ 

-*o||)) 

< 

P{L 

+  K  (A||xn  —  xq  +  (1 

-  A)||xr 

»-i  -  a;_i| 

II  + 1 

| Xn  -  Xoll)) 

< 

P(L 

+  K  ((1  +  A)||xn  — 

x0|| 

+  (1- 

||^n— 1 

-  X- 

lll)) 

< 

P(L 

+  K  ((1  +  A)| \xn  — 

x0|| 

+  (1- 

||^n— 1 

-  X0 

+  (1  —  A)||xq 

< 

P(L 

+  K(2R  +  (1  -  A) 

«)) 

< 

1. 
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Además, 


Pn  II  < 


P 


1  —  P(L  P  K(2R  +  (1  —  A)  cu)) ' 


En  segundo  lugar,  por  el  lema  3.1,  tenemos  F(xn)  =  ([xn,  xn-\]  F]  —  An_i)  (xn  —  xn-i), 
de  manera  que 

II  A(ícn) ||  A  ||  [xn,  xn—i:  A]  An—  \  ||  || xn  xn—\  || 

<  (L  +  K\\yn_i  -  xn_i||)  \\xn  -  xn_i|| 

<  (L  +  K( \\yn-i  -  xn_i||  +  \\xn  -  xn_i||))  \\xn  -  xn—i || 

<  (L  +  K((  1  -  A)||xn_i  -  Xn-2\\  +  | \xn  -  Zn-lll))  II Xn  ~  Zn-l|| 

<  (L  +  (2  -  \)Krj)  \\xn  -  xn_i||. 


Por  lo  tanto, 


\\xn+i~xn\\  <  ||An1||  \\F(x. 


< 

< 


P(L  +  (2-X)Kr,) 


1-P(L  +  K(2R+(1  -  A)a)) 
m 

1  -  P{L  P  K (2R  P  (1  -  A)a)) 
R  \\xn  ícn_i|| 

<  Pn\\x1-x0\\ 

<  V , 


\%n  %n— 1| 


\%n  %n— 1| 


y,  en  consecuencia, 


71+1 


||^n+l  —  3^0  1 1  <  ||x¿  —  Xj_i||  <  ( Pn  p  Pn  1  +  '  '  '  +  P  p  1)11^1  —  Xq\ 

i= 0 

1  _  pn+ 1 

+1-X0H 


< 


< 


1  -  P 
V 


1  -p 

=  R, 


por  ser  P  <  1.  Luego  xn+\  G  B(x o,  R ),  para  todo  n  G  N. 

Una  vez  probado  que  la  sucesión  {xn}  está  bien  definida,  vemos  que  es  una  sucesión  de 
Cauchy.  En  efecto,  como 


|| Xn+j  ~  X 


—  Il^'n+J  Xn-\.j— 1||  p  1 1 «Tn+j  —  1  Xn+j— 2 1 1  P  "  "  "  P  H^n+l  Xn 

<  (Pj~l  P  Pj~2  4 - fPP  l)||Xn+l  ~Xn\\ 


< 


1  -Pi 
1  -P 

pn 

i  -  p 


1 1  Xnj^  ]  xr 

IP  -  P)||, 


para  j  >  1,  y  P  <  1,  es  claro  que  {x„}  es  una  sucesión  de  Cauchy.  Por  tanto,  la  sucesión 
{xn}  es  convergente. 
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Ahora,  si  lím  xn  =  x*,  vemos  que  x*  es  una  solución  de  F(x)  =  0.  Como 

n— >•  oo 

H^OuOII  <  (L  +  (2  —  A )Kr¡)\\xn  -  xn_i|| 

y  \\xn  —  xn_i||  — >  0  cuando  n  — >  oo,  por  la  continuidad  del  operador  F,  se  sigue  fácilmente 
que  F(x*)  =  0. 

Finalmente,  probamos  la  unicidad  de  la  solución  x*  en  B{x o,  R).  Suponemos  que  tenemos 
otra  solución  distinta  y*  G  B(xq,R)  de  la  ecuación  F(x)  =  0.  Sea  J  =  [y*,x*;F].  Si  J  es 
inversible,  tenemos  que  x*  =  y*,  puesto  que  J(y*  —  x*)  =  F(y*)  —  F(x*).  Para  ver  que  J  es 
inversible,  por  el  lema  de  Banach  (lema  1.22),  basta  con  ver  que  || /  —  Aq  1  J||  <  1.  En  efecto, 


llJ-AóVH  <  || Vil  ll^o-  J\\ 

<  ||  Vil  llbo^o;  F]  -  [y*,x*-F] || 

<  P(L  +  K(\\y*-y0\\  +  \\x*-x0\\)) 

<  P{L  +  K(\\y*  -  x0||  +  ||x0  -  yo\\  +  ||®* 

<  P{L  +  K(R  +  (1  -  X)a  +  R)) 

=  P(L  +  K(2R+(l-\)a)) 

<  1. 

Luego,  el  operador  J~1  existe.  ■ 

Notemos  que  existen  las  diferencias  divididas  utilizadas  [xj,Xj-i,F]  y  [yj-i,  Xj-i,  F],  ya 
que  si  existe  j  G  N  tal  que  x3  =  x3-\ ,  entonces  Xj-\  =  x*  (la  solución  buscada).  Además, 
si  Xj- 1  =  tjj-i  =  Xxj-i  +  (1  —  X)xj-2,  entonces  x3-\  =  x3- 2,  de  manera  que  x3- 2  =  x*.  En 
ambos  casos,  la  sucesión  {xn}  es  convergente  trivialmente. 

Una  vez  probada  la  convergencia  semilocal  de  la  familia  de  métodos  tipo  secante,  nues¬ 
tro  siguiente  objetivo  es  ver  cuál  es  el  dominio  de  parámetros  de  esta  familia.  Para  ello, 
trasformamos  la  ecuación  Q3.4)  en  la  siguiente  ecuación  cuadrática  equivalente: 


2  K/3t2  +  (P(L  +  K{{  1  -  X  )a  -  2y)  +  m  -  l)t  +  y  (l  -  P(L  +  (1  -  X)Ka))  =  0,  (3.6) 


y  vemos  cuándo  tiene  raíces  reales  positivas.  La  ecuación  anterior  tendrá  dos  raíces  reales 
positivas  si 

P(L  +  K((  1  —  A)a  —  2y)  +  m  —  1  <  0,  (3.7) 

1  —  P(L  +  (1  —  A )Ka)  >  0,  (3.8) 

A  =  (P(L  +  K({l-X)a-2y))  +  m-lf -%Kpy{l- P(L  +  {l-X)Ka)) 

=  (p(L  +  K{{  1  -  X)a  -  2rj))  +m-  1  +  ^8 Kpy  (1  -  P(L  +  (1  -  X)Ka))  ) 

x  [p{L  +  K((  1  -  X)a  -  2?]))  +  m  -  1  -  y/8 Ypy  (1  -  P(L  +  (1  -  X)Ka))  )  >  0. 

Observamos  que  los  dos  factores  de  A  son  <  0  si 


P(L  +  K{(  1  -  A)a  -  2rj))  +  m  +  ^8 Kp-q  (1  -  P(L  +  (1  -  A )Kct))  <  1.  (3.9) 


Además,  se  cumple  (3.7)  si  se  satisface  (3.9).  Por  lo  tanto,  la  ecuación  (3.6)  tendrá  dos  raíces 
reales  positivas  si  se  cumplen  (3.8)  y  (3.9).  Si  la  ecuación  (3.6)  tiene  dos  raíces  reales  positivas, 


3.2.  MEJORA  DE  LA  ACCESIBILIDAD 


83 


entonces  la  raíz  positiva  más  pequeña  es: 
1 


R  = 


AKÍ5 


(1  -m-P(L  +  K{{  1  -  A)a  -  2r¡)) 


L  +  K{{  1  -  A )a  -  2r])  +  m  -  l)2  -  8K¡3r¡  (1  -  p(L  +  (1  -  A )Ka 


(3.10) 

Notemos  que  también  podemos  considerar  que  la  ecuación  (3.6)  tenga  una  raíz  doble  sin 


más  que  tener  en  cuenta  la  desigualdad  no  estricta  en  (3.9). 


A  continuación,  vemos  cuándo  se  cumple  la  condición  (3.5)  que  aparece  en  el  teorema  3.2 
Para  ello,  distinguimos  dos  casos: 

■  a  >  r)  =>•  m  —  P(L  +  K{{  1  —  A) a  +  rj)), 

■  a  <r¡  =>•  m  =  P(L  +  (2  —  A )Kr¡). 

Si  a  >  entonces 

1 


R  = 


AKd 


(1  -  p{2 L  +  Jl  (2(1  -  A)a  -  r¡)) 


y/{P{2 L  +  A' (2(1  -  A)a  -  r¡))  -  l)2  -  8 Kf5r]  (1  -  0(L  +  (1  -  X)Ka))  ) 


y,  de  (3.5),  se  sigue 
1 


^  (l  +  Kprj  -  \J (P(2L  +  K (2(1  -  A)a  -  r¡))  -  l)2  -  8Kf3r)  (1  -  fi{L  +  (1  -  A) /la))  )  <  1, 


(2 L  +  K (2(1  -  A)a  -  r¡ ))  -  1  y  -  8 Kf3r]  (1  -  (3(L  +  (1  -  A )Ka))  >  K(3r]  -  1. 

Para  que  se  cumpla  la  última  desigualdad,  basta  con  que  se  cumpla  K¡3r¡  —  1  <  0;  es  decir, 

K¡3r)  <  1.  (3.11) 


Por  lo  tanto,  la  condición  (3.5)  del  teorema  3.2  se  cumple  si  se  verifica  (3.11)  cuando  a>r¡. 


Por  otra  parte,  si  a  <  r¡,  entonces 
1 


R  = 


4K/3 


(1  -  P(2L  +  K((  1  -  A)a  -  A r¡)) 


2 L  +  K({  1  -  A )a  -  Ar/))  -  l)2  -  8 KPr¡  (1  -  P{L  +  (1  -  A )Ka))  j 


y,  de  (3.5),  se  sigue 


-  (1  +  KP{{  1  —  A)a  +  rj) 


-  y/(P{2L  +  K((l  -  A )a  -  r¡))  -  l)2  -  8KpV  (1  -  p(L  +  (1  -  X)Ka))  )  <  1, 

(2 L  +  K((  1  -  A )a  -  rj))  -  l)2  -  8 Kfir)  (1  -  P(L  +  (1  -  A )Ka))  >  I<P((  1  -  A )a  +  rj)  -  1. 

Para  que  se  cumpla  la  desigualdad  anterior  basta  con  que  se  cumpla  KP((l  —  X)a+rj)  —  l  <  0; 
es  decir, 


KP((  1  —  A)a  +  rj)  <  1. 


(3.12) 
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Por  lo  tanto,  la  condición  (3.5)  del  teorema  3.2  se  cumple  si  se  verifica  (3.12)  cuando  a  <  y 


Destacamos  que  no  consideramos  la  posibilidad  de  que  la  ecuación  cuadrática  (3.4)  tenga 


una  raíz  real  positiva  y  otra  negativa  porque,  en  este  caso,  la  raíz  real  positiva  nunca  cumple 


la  condición  (3.5) 


En  consecuencia,  las  condiciones  de  convergencia  que  se  imponen  a  los  parámetros  a,  /3, 
rj,  L  y  K,  como  son  que  la  ecuación  (3.4)  tenga  al  menos  una  raíz  real  positiva  y  que  la  raíz 
positiva  más  pequeña  de  (3.4),  denotada  por  R,  cumpla  (3.5),  se  van  a  cumplir  siempre  que 


se  verifiquen  (3.8),  (3.9)  y  (3.11)  cuando  a  >  y  o  (3.8),  (3.9)  y  (3.12)  cuando  a  <  y.  Así, 


enunciamos  entonces  el  siguiente  resultado,  cuya  demostración  se  sigue  fácilmente  sin  más 


que  satisfacer  las  hipótesis  del  teorema  3.2 


Corolario  3.3.  Sean  X  e  Y  dos  espacios  de  Banach  y  F  :  ó  C  X  — >■  Y  un  operador  no  lineal 
definido  en  un  dominio  abierto  convexo  no  vacío  ó.  Una  vez  fijado  A  G  [0, 1),  suponemos  que 
se  cumplen  las  condiciones  (C1)-(C3),  (3.3),  ÜJ)  y  (ó.  h|( .  Además,  si  se  cumplen  l¡3.11\) 
cuando  a  >  y  o  (3.12)  cuando  a  <y  y  B(x0,R )  C  ó,  donde  R  está  definido  en  (3.10)  con 
m  =  máx{/3(L  +  /ó((l  —  A )a  +  y)),  (3(L  +  (2  —  A )Ky)},  entonces  la  sucesión  {xn}  dada  por  los 
métodos  tipo  secante,  empezando  en  X- 1  y  xq,  está  bien  definida  y  converge  a  una  solución 
de  F(x)  =  0.  Además,  la  solución  x*  y  las  iteraciones  xn  pertenecen  a  B(xq,R)  y  x*  es 


x 


única  en  B(x o,  R)  fl  O. 

Ahora,  representamos  gráficamente  el  dominio  de  parámetros  asociado  al  corolario  ante¬ 
rior.  Para  representarlo  gráficamente,  se  colorean  en  un  plano  xy,  con  x  —  K/3r)  e  y  —  Kfia , 


los  valores  de  los  parámetros  que  verifican  las  condiciones  (3.8),  (3.9)  y  (3.11),  si  a  >  y,  o 


(3.12),  si  a  <  y,  que  se  imponen  en  el  corolario  anterior.  Observamos  que  las  condiciones 


exigidas  a  los  puntos  de  salida,  (C1)-(C3),  introducen  los  parámetros  a,  ¡3  y  y,  y  la  con¬ 
dición  exigida  al  operador  F,  (|3.3 ),  introduce  los  parámetros  fijos  L  y  K .  A  continuación, 
distinguimos  dos  casos:  el  caso  diferenciable,  L  —  0,  y  el  no  diferenciable,  L^O. 

Comenzamos  con  el  caso  diferenciable.  Como  se  puede  ver  en  las  figuras  [37T| y  |3. 2 [  el  nuevo 
dominio  de  parámetros  (figura  3.1)  resuelve  el  problema  que  tienen  los  métodos  tipo  secante 


en  el  dominio  de  parámetros  asociado  al  teorema  2.2  (figura  3.3)  cuando  los  valores  de  y  son 
pequeños  para  un  valor  fijo  de  a.  Fijado  un  valor  de  K/3a  perteneciente  al  dominio  de  pará¬ 
metros,  observamos  que  el  valor  de  K(3y  sólo  está  acotado  superiormente  y  no  inferior  mente. 
Notamos  que  las  regiones  están  superpuestas. 


cuan- 


En  segundo  lugar,  representamos  el  dominio  de  parámetros  asociado  al  teorema  |3. 2 
do  F  es  no  diferenciable,  L  0.  En  este  caso,  el  dominio  de  parámetros  depende  de  la 


cantidad  L/3,  que  tiene  que  cumplir  que  L¡3  <  ^ ,  sin  más  que  observar  la  condición  (|3.9|).  Así, 


representamos  gráficamente  los  casos  L/3  =  A  y  L/3  =  A  en  las  figuras  3.4 


y 


3.5 


respectiva¬ 


mente.  Observamos  que  el  dominio  de  parámetros  se  reduce  al  aumentar  el  valor  de  L/3,  pero 
sigue  teniendo  buenas  características  locales.  Notamos  que  las  regiones  están  superpuestas. 


3.3.  Aplicación 


A  continuación  ilustramos  todo  lo  visto  en  la  sección  anterior  con  dos  sistemas  de  ecua¬ 
ciones  no  lineales.  En  primer  lugar,  consideramos  un  sistema  de  ecuaciones  no  lineales  dife¬ 
renciable  y  vemos  que  no  podemos  garantizar  la  convergencia  semilocal  de  los  métodos  tipo 


secante  mediante  el  teorema  2.2,  pero  si  que  lo  podemos  hacer  mediante  el  teorema  3.2  En 
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Figura  3.1:  Dominios  de  parámetros  de  los 
métodos  tipo  secante  asociados  al  corolario 
3.3  cuando  L  =  0  y  A  =  0,  |,  (verde, 
rosa,  amarillo  y  morado,  respectivamente). 


Figura  3.2:  Dominios  de  parámetros  de  los 
métodos  tipo  secante  asociados  al  teore¬ 
ma  |2.2|  y  al  corolario  |3.3|  cuando  L  =  0  y 


A  =  0,  |,  |,  |  (verde,  rosa,  amarillo  y  mora¬ 
do,  respectivamente). 


segundo  lugar,  consideramos  un  sistema  de  ecuaciones  no  lineales  no  diferenciablc  y  vemos 


que  el  teorema  3.2  garantiza  la  convergencia  semilocal  de  los  métodos  tipo  secante. 


3.3.1.  Sistema  de  ecuaciones  no  lineales  diferenciable 

Sea  la  siguiente  ecuación  integral  no  lineal  de  tipo  Hammerstein 

x(s)  —  1  +  f  G(s,t)  x(t)2  dt,  sE  [0,1], 

Jo 

donde  i  G  C[0, 1]  y  G  es  la  función  de  Green  en  [0, 1]  x  [0,1]. 


(3.13) 


A  continuación,  mediante  un  proceso  de  discretización,  transformamos  (3.13)  en  un  pro¬ 


blema  de  dimensión  finita,  tal  y  como  se  hizo  en  la  sección  1.6.1  del  capítulo  [l ,  de  manera 
que  obtenemos  el  siguiente  sistema  de  ecuaciones  no  lineales: 


F(x)  =  x  -  1  -  Ax  =  0, 


(3.14) 


donde 


X=  (xi,x2,...,x8)t,  1  =  (1,1,...,1)t,  A  =  (aij)ij=1, 

En  este  caso,  el  operador  diferencia  dividida  considerado  es 


[u, v;  F]  =  I  -  -A  diag{z}, 


2  2 


X  =  (X  -,  .  X 


1  5  •ÁJ2l  ■  ■  ■  ■ 


xl)T. 


donde  z  =  (zi,  z2, . . . ,  z$)T  y  z¡  =  Ui  +  vi:  para  todo  i  =  1,  2, . . . ,  8. 
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Figura  3.3:  Dominios  de  parámetros  de  los  métodos  tipo  secante  asociados  al  teorema  |2.2 
cuando  A  —  0,  |,  |  (regiones  verde,  rosa,  amarilla  y  morada,  respectivamente). 


=  I  y 


Eligiendo  x_x  =  (^,  . . . ,  yx0  =  (1,1,...,  1)T  como  puntos  de  salida,  A 

la  norma  del  máximo,  obtenemos  a  =  0.1,  ¡3  =  1.3035 . . .,  r¡  =  0.1556 . . .  y  K  =  0.1235 . . 
Vemos  entonces  que  la  primera  condición  de  (|2.5[)  del  teorema  2.2  no  se  cumple  puesto  que 


V 


a  +  r] 


=  0.6088 


>  —A—  —  0.3819 . . . 


En  consecuencia,  no  podemos  garantizar  la  convergencia  del  método  tipo  secante  con  A  =  | 
mediante  el  teorema  |2.2  del  capítulo  anterior.  Sin  embargo,  si  que  la  podemos  garantizar 
mediante  el  teorema  3.2,  puesto  que  la  correspondiente  ecuación  (3.4)  es 


t  1 


(0.0376...) 


(0.1610...  )(2í  +  0.05) 


(0.1556...)  =  0, 


que  tiene  dos  raíces  reales  positivas  y  la  más  pequeña,  denotada  por  R  =  0.1621 . . .,  cumple 
la  condición  (3.5): 

PK(2R  +  (1  -  A)a)  =  0.0602  . . .  <  1. 

En  este  caso,  utilizando  el  método  tipo  secante  correspondiente  a  A  =  ],  después  de  cinco 
iteraciones  y  usando  el  criterio  de  parada  ||xn  —  xn„1|¡  <  10~16,  obtenemos  la  aproximación 
numérica  x*  =  (arj,;^,  •  •  •  ixl)T  de  una  solución  de  (3.14)  que  vemos  en  la  tabla  3.1  En  la 


tabla  3.2  mostramos  los  errores  ||xr 


obtenidos  usando  el  mismo  criterio  de  parada. 


Notemos  que  el  vector  dado  en  la  tabla  3.1  es  una  buena  aproximación  de  la  solución  del 


sistema  (3.14),  puesto  que  ||F(x*)||  <  constante  x  10  16.  Mostramos  la  sucesión  {||F(xn)||} 
en  la  tabla  13.21 


Además,  por  el  teorema  3.2  la  existencia  y  unicidad  de  la  solución  está  garantizada  en  la 


bola  -B(x0,  0.1621 . . .). 


3.3.  APLICACIÓN 


87 


Figura  3.4:  Dominios  de  parámetros  de  los 
métodos  tipo  secante  asociados  al  corolario 


rosa,  amarillo  y  morado,  respectivamente). 


3.3 


cuando  L/3  =  ^  y  A  =  0,  §  (verde, 


Figura  3.5:  Dominios  de  parámetros  de  los 
métodos  tipo  secante  asociados  al  corolario 
3.3  cuando  L/3  =  |  y  A  =  0,  |,  |  (verde, 

rosa,  amarillo  y  morado,  respectivamente). 


i 

x* 

i 

x * 

i 

x* 

i 

x* 

1 

1.012239... 

3 

1.118079... 

5 

1.159804... 

7 

1.058428... 

2 

1.058428 . . . 

4 

1.159804... 

6 

1.118079... 

8 

1.012239. . . 

Tabla  3.1:  Aproximación  de  la  solución  x*  de  (3.14) 


3.3.2.  Sistema  de  ecuaciones  no  lineales  no  diferenciable 

Consideramos  ahora  la  siguiente  ecuación  integral  no  lineal  de  tipo  Hammerstein 


^  =  2  +  4, 


G(s,t )  (x(t)2  +  |x(í)|)  dt ,  sG  [0,1], 


(3.15) 


donde  x  €  C[0, 1]  y  G  es  la  función  de  Green  en  [0, 1]  x  [0,1]. 

A  continuación,  de  nuevo  tal  y  como  se  hizo  en  la  sección  1.6.1,  transformamos  (3.15)  en 
el  siguiente  sistema  de  ecuaciones  no  lineales: 


=  x  -  \  -  Ai  +  X)  =  0,  F  : 


(3.16) 


donde 


X  =  (. XUX2 ,  •  •  -,X8)T, 


1 

2  " 

x=  (x1,x2,...,x8)  , 


1  1 

2’  2’ 


Dt 

’  2, 


X  =  (|xi|,  \x2\, . . . 
En  este  caso,  el  operador  diferencia  dividida  considerado  es 


(°hi)¿j= i, 

,  ks|)T- 


[u,  v;  F\  =  I  -  -A  (diagjz}  +  diag(wj), 


CAPÍTULO  3.  SITUACIÓN  (NO)-DIFERENCIABLE 


n 

||xn 

-x*|| 

||F(x 

n)  || 

-1 

2.5980. 

..  x  10’1 

2.0008... 

x  10"1 

0 

1.5980. 

..  x  10"1 

1.2355... 

x  lO”1 

1 

4.1222. 

. .  x  10~3 

3.1494. . . 

x  10“3 

2 

4.1117. 

. .  x  10~5 

3.1489... 

x  10“5 

3 

1.0346 . 

. .  x  10“8 

9.9173... 

x  10“9 

4 

2.5597. 

. .  x  10-14 

1.9590... 

x  10~14 

Tabla  3.2:  Errores  absolutos  obtenidos  con  el  método  tipo  secante  correspondiente  a  A  =  \  y 

ll^(x„)|| 


donde  z  =  (z\,  Z2,  ■  ■  ■ ,  z$)T  con  =  Ui  +  u¿,  para  todo  i  =  1,  2, . . . ,  8,  y  w  =  (wi,w2, . . . ,  w$)T 
con  Wi  =  llüóM  para  todo  i  =  1,  2, . . . ,  8. 

Ui  Ví 

Eligiendo  x_i  =  (|,  |, . . . ,  y  x0  =  (|,  |, . . . ,  como  puntos  de  salida,  A  =  |  y 
la  norma  del  máximo,  obtenemos  a  =  0.1,  ¡3  =  1.2170 . . .,  r¡  =  0.0824. . .,  L  =  0.1853 ...  y 
K  =  0.0926 ...  La  ecuación  (3.4[)  se  reduce  a 


t  1- 


(0.2376. 


1  -  (1.2170  . .  ,)((0.1863  . . .)  +  (0.0926  . .  ,)(2í  +  0.0250  . . .) 


-  (0.0824...)  =  0, 


que  tiene  dos  raíces  reales  positivas  y  la  más  pequeña,  denotada  por  R  =  0.1211 . . .,  cumple 


la  condición  (3.5): 


P(L  +  K(2R  +  (1  -  A)a))  =  0.2557 . . .  <  1. 

Así,  mediante  el  teorema  |3.2,  podemos  garantizar  la  convergencia  semilocal  del  método  tipo 


secante  correspondiente  a  A  =  |  a  una  solución  del  sistema  (|3.16|).  Es  más,  por  el  teorema 
la  existencia  y  unicidad  de  solución  está  garantizada  en  la 


3.2 


Dola  B(x o,  0.1211 . . .). 

Después  de  cuatro  iteraciones  y  usando  el  criterio  de  parada  ||xn  —  xn_x  |[  <  10-16, 
tenemos  la  aproximación  numérica  x*  =  (x*,^, . . .  ,Xg)T  de  una  solución  (3.16)  que  vemos 


ob- 


en  la  tabla  3.3  En  la  tabla  3.4  mostramos  los  errores  ||xn  —  x*||  obtenidos  usando  el  mismo 


criterio  de  parada.  Notemos  que  el  vector  dado  en  la  tabla  |3.3|  es  una  buena  aproximación 
de  la  solución  del  sistema  (3.16),  puesto  que  ||F(x*)||  <  constante  x  10-16.  Mostramos  la 


sucesión  {||F(xn)||}  en  la  tabla  3.4 


i 

i 

x* 

i 

x* 

i 

X* 

1 

0.506462 . . . 

3 

0.561738... 

5 

0.583219... 

7 

0.530722 . . . 

2 

0.530722 . . . 

4 

0.583219... 

6 

0.561738... 

8 

0.506462 . . . 

Tabla  3.3:  Aproximación  de  la  solución  x*  de  (3.16) 
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n 

||xn 

-x* 

ll^Xn) 

-1 

1.8321 

. .  x  10'1 

1  5189 

.  x  10"1 

0 

8.3221 

. .  x  1CT2 

6  9501 

es 

1 

O 

X 

1 

7.8399. 

X 

t— 4 

o 

i 

6  5351 

.  x  10~4 

2 

1.4181. 

<o 

1 

O 

rt 

X 

1.1832. 

.  x  10~6 

3 

2.3181. 

.  x  10-11 

1.9352 

.  x  10“n 

Tabla  3.4:  Errores  absolutos  obtenidos  con  el  método  tipo  secante  correspondiente  a  A  =  |  y 

ll^Xn)!! 
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EL  MÉTODO  DE  STEFFENSEN 


91 


93 


En  esta  parte  del  texto  consideraremos  un  operador  F  :  Í2  C  X  — >  X,  donde  Q  es  un 
dominio  abierto  convexo  no  vacío  contenido  en  un  espacio  de  Banach  X,  y  nos  planteamos 
la  aproximación  de  una  solución  de  la  ecuación 

F(x)  =  0 


mediante  un  método  iterativo  punto  a  punto  que  no  evalúe  derivadas  del  operador  F  en 
cada  paso.  Este  tipo  de  métodos  iterativos  tienen  gran  interés  debido  a  que  la  derivada  del 
operador  F  puede  ser  costosa  de  evaluar  o  porque  incluso  puede  no  existir,  situaciones  que  son 
desfavorables  para  la  aplicación  del  método  de  Newton,  cuyo  algoritmo,  como  bien  sabemos, 
está  dado  por 

í  dado  xo  en  O, 

\  xn+1  =xn-  [. F'ixn)]-1F(xn ),  n  >  0. 


Usualmente  la  no  utilización  de  derivadas  pasa  por  la  aproximación  de  éstas.  Así,  como 
bien  sabemos,  en  el  caso  de  espacios  de  Banach,  podemos  considerar  el  concepto  de  diferencia 
dividida.  Es  conocido  que,  dado  x  G  X ,  si  consideramos  un  punto  y  E  X  distinto  de  x, 
próximo  a  x,  el  operador  [x,y,F]  representa  una  aproximación  de  F'(x).  Utilizando  este 
hecho,  es  habitual  construir  métodos  iterativos  que  utilizan  diferencias  divididas  en  vez  de 
derivadas. 

Como  en  la  parte  anterior  de  este  texto,  nuestro  punto  de  partida  es  el  método  de  Newton. 
Para  eliminar  de  su  algoritmo  la  evaluación  de  las  derivadas  del  operador  F,  utilizamos  una 
aproximación  de  F'(x)  a  partir  de  determinada  diferencia  dividida.  Como  el  objetivo  singular 
de  esta  parte  del  texto  es  la  construcción  de  un  método  iterativo  punto  a  punto,  teniendo 
en  cuenta  las  características  del  operador  considerado  y  tomando  como  nodos  x  y  x  +  F(x), 
podemos  utilizar  éstos  para  considerar  la  aproximación  F'(x)  ~  [x,x  +  F(x)]F],  A  partir 
de  esta  aproximación,  definimos  el  método  de  Steffensen,  que  está  dado  por  el  siguiente 
algoritmo: 

í  dado  x0  en  Í2, 

\  xn+1  =  xn  —  [xn,  xn  +  F(xn)\ F}~lF(xn),  n  >  0. 


Evidentemente,  el  método  de  Steffensen  es  un  método  iterativo  punto  a  punto.  Además, 
por  la  aproximación  de  la  derivada  del  operador  F  considerada  en  este  caso,  es  conocido 
que  el  método  de  Steffensen  tiene  convergencia  cuadrática  [5j.  Por  otra  parte,  como  resulta 
evidente,  este  método  iterativo  tiene  el  mismo  coste  computacional  que  el  método  de  Newton. 
Por  tanto,  la  eficiencia  computacional  (P5¡>  @5])  del  método  de  Steffensen  es  la  misma  que  la 
del  método  de  Newton.  Pese  a  las  buenas  características  que  tiene  el  método  de  Steffensen, 
misma  eficiencia  computacional  que  el  método  de  Newton  y  la  no  evaluación  de  derivadas,  es 
mucho  menos  utilizado  que  el  método  de  Newton  para  aproximar  soluciones  de  la  ecuación 
F(x)  =  0.  Nuestro  objetivo  principal  se  va  a  centrar  entonces  en  mejorar  la  aplicabilidad  del 
método  de  Steffensen. 

Como  hemos  dicho  en  la  sección  L5  del  capítulo [lj  el  aspecto  central  a  la  hora  de  estudiar 
la  aplicabilidad  de  un  método  iterativo  es  su  accesibilidad.  Experimentalmente,  podemos  verla 
mediante  las  cuencas  de  atracción,  que  recordamos  que  son  el  conjunto  de  todos  los  puntos 
de  salida  a  partir  de  los  cuales  el  método  iterativo  converge  a  una  solución  de  F(x)  =  0, 
fijada  una  tolerancia  o  un  número  máximo  de  iteraciones. 

A  continuación,  en  las  figuras  333  y  3U  mostramos  las  cuencas  de  atracción  asociadas  a 
las  tres  raíces  z*  —  1,  z**  —  exp 


(  27TÁ 
3 


y  z  =  exp 


(Hr1)  ecuación  F(z)  =  z3  —  1  =  0, 
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donde  F  :  C  — *  C,  cuando  aplicamos  respectivamente  los  métodos  de  Newton  y  de  Steffensen. 
Para  representar  las  cuencas  de  atracción  de  las  tres  raíces  de  la  ecuación  anterior,  liemos 
seguido  la  misma  estrategia  que  la  descrita  en  la  sección  fl-5.2| para  el  método  de  Newton. 


-2-10  1  2 

Figura  3.6:  Cuencas  de  atracción  asociadas 
a  las  tres  raíces  de  F(z)  =  z3  —  1  =  0  para 
el  método  de  Newton. 


-2-10  1  2 


Figura  3.7:  Cuencas  de  atracción  asociadas 
a  las  tres  raíces  de  F(z)  =  z3  —  1  =  0  para 
el  método  de  Steffensen. 


Vemos  que  las  cuencas  de  atracción,  cuando  aplicamos  el  método  de  Steffensen,  se  reducen 
considerablemente  con  respecto  a  las  del  método  de  Newton,  lo  que  justifica  claramente  su 
menor  uso  con  respecto  al  de  Newton  a  la  hora  de  resolver  ecuaciones  no  lineales. 

También  hemos  indicado  en  la  sección  L5  del  capítulo  [T|  que,  aparte  del  estudio  empírico 
de  la  accesibilidad  de  un  método  iterativo  dado  por  las  cuencas  de  atracción,  podemos  realizar 
un  estudio  de  la  accesibilidad  del  método  iterativo  a  partir  de  las  condiciones  de  convergencia 
impuestas  al  método  iterativo,  mediante  la  región  de  accesibilidad  y  el  dominio  de  parámetros. 

En  el  capítulo  [4]  de  esta  parte  del  texto  realizamos  un  estudio  de  la  convergencia  semilocal 
del  método  de  Steffensen  mediante  el  principio  de  la  mayorante  de  Kantorovich,  de  manera 
que  podamos  comparar  su  accesibilidad  con  la  del  método  de  Newton  bajo  condiciones  de  tipo 
Kantorovich.  Así,  vemos  que  el  dominio  de  parámetros  asociado  al  resultado  de  convergencia 
semilocal  del  método  de  Steffensen  es  más  pequeño  que  el  del  método  de  Newton.  Para 
solventar  esta  situación,  construimos  un  método  iterativo  híbrido  (predictor-corrector)  que 
no  evalúe  derivadas  en  cada  paso  y  con  la  misma  accesibilidad  que  el  método  de  Newton. 

La  utilización  de  la  teoría  de  Kantorovich  en  el  capítulo  [4]  para  estudiar  la  convergencia 
semilocal  de  los  métodos  iterativos  nos  obliga  a  considerar  ecuaciones  con  operadores  diferen¬ 
ciadles.  Así,  en  el  capítulo  [5j  modificamos  las  condiciones  de  convergencia  consideradas  en  el 
capítulo  [4]  y  desarrollamos  una  teoría,  basada  en  relaciones  de  recurrencia,  que  proporciona 
resultados  de  convergencia  semilocal  y  permite  aproximar  soluciones  de  ecuaciones  definidas 
mediante  operadores  cualesquiera,  tanto  diferenciables  como  no  diferenciables.  Después,  a 
partir  del  estudio  de  los  dominios  de  parámetros  asociados  a  los  nuevos  resultados,  construi¬ 
mos  un  método  iterativo  híbrido  (predictor-corrector)  aplicable  a  ecuaciones  con  operadores 
cualesquiera  y  con  una  buena  accesibilidad  de  soluciones. 


Capítulo  4 

Situación  diferenciable 


Comenzamos  este  capítulo  realizando  un  estudio  de  la  convergencia  scmilocal  del  método 
de  Steffensen  mediante  el  principio  de  la  mayorante  de  Kantorovich.  Hemos  visto  antes  que 
para  establecer  un  resultado  de  convergencia  semilocal  se  exigen  dos  tipos  de  condiciones: 
condiciones  sobre  los  puntos  de  salida  y  condiciones  sobre  el  operador  implicado.  Como 
nuestro  primer  interés  se  centra  en  el  estudio  comparativo  de  la  accesibilidad  de  los  métodos 
de  Newton  y  de  Steffensen  a  partir  de  la  teoría  de  Kantorovich,  exigimos  la  misma  condición 
al  operador  F: 

\\F,(x)-F,(y)\\<C\\x-y\\,  C>  0,  Vaqr/GÜ; 

es  decir,  que  F'  sea  Lipschitz  continua  en  Q.  Notemos  en  primer  lugar  que,  a  partir  de  la 
condición  anterior,  siempre  existe  la  diferencia  dividida 


[x,  y-,F}=  I  F'  O  +  t(x  -  y))  dr , 
Jo 


para  cualesquiera  que  sean  los  puntos  x,  y  G  ÍL  Si  x  =  y,  entonces  [x,x;F]  =  F'(x), 
Luego  el  método  de  Steffensen  está  bien  definido  en  cada  paso. 

A  partir  del  estudio  de  la  convergencia  semilocal  del  método  de  Steffensen,  que  realizare¬ 
mos  mediante  la  teoría  de  Kantorovich,  probamos  que  la  accesibilidad  del  método  de  Newton 
es  mucho  mejor  que  la  que  se  obtiene  para  el  método  de  Steffensen  en  las  mismas  condiciones. 


En  la  sección  4.1  obtenemos  un  teorema  de  convergencia  semilocal  para  el  método  de  Stef¬ 
fensen  mediante  la  teoría  de  Kantorovich.  Luego,  comparamos  la  accesibilidad  de  los  métodos 
de  Newton  y  de  Steffensen.  Adelantamos  que  las  diferencias  que  se  observan  experimental¬ 
mente  con  las  cuencas  de  atracción  de  las  tres  raíces  de  la  ecuación  F(z)  =  z2,  —  1  =  0  se 
confirman  en  el  estudio  teórico. 


A  continuación,  en  la  sección  |4.2[  consideramos  el  método  simplificado  de  Newton,  cuyo 
algoritmo  es 

í  dado  £0  en  Í2, 

\  zn+ 1  =  zn-  [F'(z0)]~1F(zn),  n  >  0, 

observamos  que  no  se  evalúa  F'  en  un  nuevo  punto  en  cada  paso,  sino  que  basta  considerar 
un  punto  z0  de  Í2  donde  se  evalúe  F'  y  vemos  que  este  método  tiene  la  misma  accesibilidad 
que  el  método  de  Newton. 

construimos  un  método  iterativo  híbrido 


Teniendo  en  cuenta  lo  anterior  en  la  sección  4.3 


(predictor-corrector)  considerando  el  método  simplificado  de  Newton  (predictor)  en  unos 
primeros  pasos  para  localizar  un  punto  de  salida  favorable  para  el  método  de  Steffensen 
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(método  corrector).  Este  método  híbrido  tiene  la  misma  accesibilidad  que  el  método  de 
Newton,  pero  no  evalúa  derivadas  en  cada  paso.  En  particular,  saliendo  desde  los  mismos 
puntos  de  salida  que  el  método  simplificado  de  Newton,  garantizamos  la  convergencia  del 


método  híbrido.  Finalmente,  en  la  sección  4.4,  veremos  una  aplicación  en  la  que  consideramos 
un  sistema  de  ecuaciones  no  lineales  que  ilustra  todo  lo  anterior. 


4.1.  Método  corrector:  el  método  de  Steffensen 

4.1.1.  Convergencia  semilocal 

A  continuación,  suponemos  que  se  satisfacen  las  siguientes  condiciones: 

(Al)  ||F(*0)||<«5, 

(A2)  existe  r0  =  [F'Vo)]-1  £  C(X,X),  para  xo  G  ó,  y  es  tal  que  ||r0||  <  6, 

(A3)  \\F'(x)  —  F\y)\\  <  C\\x  —  y\\,  C  >  0,  x,yeSl. 

En  primer  lugar,  establecemos  la  convergencia  semilocal  del  método  de  Steffensen,  bajo  las 
condiciones  (Al)-(A3),  de  manera  similar  a  la  dada  para  el  método  de  Newton  en  el  teorema 
de  Newton- Kantorovich  (teorema  1.53  del  capítulo  [I]) ,  utilizando  entonces  el  principio  de  la 
mayorante  de  Kantorovich. 

Lo  primero  que  vamos  a  hacer  es  probar  la  existencia  del  operador  [x0,  yo',  F]-1  G  £(X,  A") 
para  Xo,yo  G  ó.  Así, 

\\I  -  r0[x0,?/o;F]||  <  ||r0|| H-F'^o)  —  [x0,y0-,F]\\ 

=  HE 


F'(x  o)-/  F' (x0  +  r(y0  -  x0))  dr 
Jo 

<  ||r0||  [  \\F'(x0  +  T(yo- x0))  -  F\x0)\\dT 
Jo 


<  -ese, 

-  2 

de  modo  que,  si  C59  <  2,  existe  [xo,  yo ;  F]”1  G  jC(X,  X),  para  xq,  yo  G  ó,  y  es  tal  que 

29 


[x0,yo]F] 


-i 


< 


2  -ese 

A  continuación,  definimos  el  polinomio  cuadrático 


=  b. 


?W  =  y  ~-b  +  s, 


=  C  1  + 


s  G  [0,  s'], 


(4.2) 


tal  que  s*  <  s**  <  s',  donde  denotamos  la  raíz  positiva  más  pequeña  del  polinomio  q  por 

i  -  Vi  -  2 m2  „  1  +  VI  -  2 £ÓW  ,  ,  /  r  -.  ,  „  .  , 

s  =  - - - y  la  mayor  por  s  = - — - ,  y  la  sucesión  |sn)  definida  por 


ib 


s0  =  0, 


fú,  „  >  o,  (43) 

q{Sn) 

Observemos  que  la  sucesión  {sn}  converge  de  forma  creciente  a  s*,  sin  más  que  tener  en 
cuenta  que  {sn}  es  una  sucesión  monótona  no  decreciente  y  está  acotada  superiormente  por 


4.1.  MÉTODO  CORRECTOR:  EL  MÉTODO  DE  STEFFENSEN 
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Teorema  4.1.  Sean  X  un  espacio  de  Banach  y  F  :  0  C  X  — >•  X  un  operador  una  vez 
continuamente  diferenciable  Fréchet  definido  en  un  dominio  abierto  convexo  no  vacío  Í2.  Si 
se  cumplen  las  condiciones  (A1)~(A3),  se  satisfacen  las  condiciones 

C56  <  2,  idb2  <  ^  (4.4) 

y  B[x o,  s*  +  h)  C  D,  entonces  el  método  de  Steff ensen  converge,  a  partir  de  x0,  a  una  solución 
x*  de  F(x)  =  0.  Además,  la  solución  x*  y  las  iteraciones  xn  pertenecen  a  B(x0,s*  +  5)  y  x* 
es  única  en  Bfxo,s**  +  S)  fl  fl,  donde  s**  =  l+XXAFFi . 

Demostración.  Probamos  la  convergencia  semilocal  del  método  de  Steffensen  utilizando 
un  proceso  inductivo. 

Notemos  que 


\Xi  Xq  ||  = 


[x0,  y0',  F]  F(x0)  <  bó  =  Sí  -  s0  <  s*  +  ó, 


de  manera  que  X\  G  B(x0,  s*  +  5)  C  ó  y  podamos  definir  x2 .  A  continuación,  como 


F(x1)  =  F(x1)  -  F(x0)  -  [xo^o^Fjfxi  -  xQ) 

=  f  (F'(z)  -  F'(x0))  dz  +  (F'(x0)  -  [x0,y0-,  F])  (oq  -  x0) 

JXq 

=  [  (F'(x o  +  r(x i  -  x0))  -  F'(x 0))  dr(x 1  -  x0)  +  (F'(x 0)  -  [x0,  y0 ;  F})  (aq  -  xQ), 
Jo 


vemos  que 


II^(d)||  <  ^||ti  -x0||2  +  ^-||ir(:r0)||||x1  -x0|| 
<  y  (-Si  —  S0)2  +  —  <7(s0)(si  —  s0) 

=  j  (i  -  q'M)  (si  -  so)2 

=  2^Sl~s°^2 
=  q(si). 


Ahora,  puesto  que  la  sucesión  {sn},  dada  en  (4.3),  es  creciente  y  el  polinomio  (4.2)  es  decre¬ 
ciente  en  [0,s*],  se  tiene 


|| 2/i  -  34)11  <  ||aq  -  x0||  +  ||F(xi)||  <  si  -  s0  +  q(si)  <  s*  +  q(s0)  =  s*  +  6. 


Notemos  que,  para  poder  definir  x2,  necesitamos  la  existencia  del  operador  [xi,yp,F\  1 . 


Teniendo  de  nuevo  en  cuenta  nuevamente  que  la  sucesión  (4.3)  es  creciente  y  el  polinomio 
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(4.2)  es  decreciente  en  [0,  s*],  se  tiene 

||J-r0[x1,|/1;F]||  < 


< 

< 

< 

< 

< 


r0||  im*o)-[*1,y1;inil 

r0||(||F'(o:o)-F'(a:1)||  +  ||F'(a;1)-[x1,1/1;F]||) 

-  ®o||  +  Jo  \\F'(%i  +  r{yi  -  xx))  -  F' 


r0 

r0 

r0 

r0 

r0 


xo\\  +  Y 


—  So)  + 


C 


C  1 


_  ^(so)\ 


2  J 


Si 


de  modo  que  el  operador  [aq,  yy,  F]  1  existe  y  es  tal  que 

9 


II  [^i,  2/i -,F]  II  < 


< 


1- ||/-r0[xi,2/i;F]||  g'(si)' 


Entonces, 


\\x2  -  xi||  <  <  s2  -  si, 

q (si) 

\\x2  -  x0||  <  ||x2  -  aq||  +  ||aq  -  x0||  <  S2  -  So  <  s*  <  s*  +  8 

y  X2  G  B{x o,  s*  +  ó)  C  ó,  lo  que  permite  definir  y 2. 

Ahora,  a  partir  de 

F{xn )  =  F(xn)  -  F(xn_ i)  -  [xn_1:yn.i,  F](xn  -  xn_!) 

fXn 

=  /  (F'(z)  —  F'(xn-i))  dz  +  (F'(xn-i)  —  [xn-i,yn-i]  F])  (xn  —  xn-±) 

JXn-1 

=  f  {F\xn- 1  +  r(xn  -  xn-i))  -  F\xn-i))  dr(xn  -  xn-X) 

Jo 

F  (F  (xn—i )  [^-n— 1 ,  yn— 1  j  F] )  (íCn  ÍCn_i) 

=  f  (F'(xn- i  +  r(xn  -  xn_i))  -  F'(xn- i))  dr(xn  -  xn_i) 

Jo 

+  f  {F'(xn_ i)  -  F'(xn-i  +  r(yn_i  -  xn_i)  dr)  (xn  -  xn_x) 

Jo 


4.1.  MÉTODO  CORRECTOR:  EL  MÉTODO  DE  STEFFENSEN 
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q(sn)  =  q(sn)  -  q(sn- 1)  -  g'0n-l)0n  -  Sn_i) 


í  (?  (&n—  1  "É  ®n— l))  Q  (®n— l))  ^T{sn  Sn— l) 

Jo 

l  [  T(sn  -  sn_i)2  dr 
Jo 


2  \^n  1 )  1 


se  tiene 


puesto  que 


II^WII  <g(s„),  VneN, 


||-F(zn)||  <  [  Cr\\xn  -  xn_i||2  dr  +  í  Cr\\F(xn-i) || \\xn  -  xn_i||  dr 

Jo  Jo 


C  C 

<  Sn  -  sn_ 1)2  +  —q(sn- i)(sn  -  sn_i) 

=  %  (1  -  </(Sn-l))  («n  -  Sn-l)2 


=  q(sn). 

Entonces,  como  el  polinomio  q  es  decreciente  en  [0,  s*],  se  sigue 

\\yn  ~  ^0 1|  <  || xn  -  x0||  +  ||F(a;n)||  <  sn  +  q(sn)  <  s*  +  q(s0)  <  s*  +  ó 

y,  por  tanto,  yn  G  B{x o,  s*  +  <5)  C  Í2. 

A  continuación,  probamos  la  existencia  del  operador  [xn,yn]  F]-1 .  Como 


||^-r0[xn,yn;F]||  < 


r0||||F'(x0)-K,?/n;F]|| 

Eoll  (ll^(^o)  -  n*n)||  +  ll^(^n)  -  [Xn,yn\F]  ||) 

r0||  (c \\xn  -  x0||  +  J  II F'(xn  +  r(yn  -  xn))  -  F'[xr 


ro||  ^||xn-x0||  +  -||F(a;n)||J 
r0||  (c{sn  —  s0)  +  —  q(sn)^j 

r0||  ^Csn  “Q1  (®n)(®ra  ^n—  l)^ 

r0||c(i-^) 


<  9  (q\sn)  + 

<  9  (y(sn)  + 


<  1, 
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tenemos  que  el  operador  [xn,yn;  F]  1  existe  y  es  tal  que 

9 


[^nj  Um  F  ]  ||  < 


< 


1  -  \\I -T0[xn,yn]F]\\  q'{sny 


Por  tanto, 


H-^n+l  Xn\\  ^  ||  [Xm  Vm  F]  II II F^Xji)  ||  U 


q(sn) 

q'(sn) 


«->71+1  $r> 


\\xn+1  -  X0||  <  ||xn+i  -  Xn\\  +  \\xn  -  X0||  <  Sn+1  -  S0  <  S*  <  S*  +  Ó, 

y,  como  {sn}  es  una  sucesión  de  Cauchy,  se  deduce  que  {xn}  también  lo  es  y,  en  consecuencia, 
{xn}  converge  ai*  £  B(x0,  s*  +  S).  Para  ver  que  x*  es  una  solución  de  la  ecuación  F(x)  =  0, 
basta  tener  en  cuenta  que  ||F(:rn)||  <  q(sn)  y,  por  la  continuidad  de  F,  tenemos  F(x*)  =  0. 

A  continuación,  probamos  la  unicidad  de  solución.  Suponemos  que  tenemos  otra  solución 
z*  G  B(x o,  s**  +  5)  fl  ó  de  la  ecuación  F(x)  =  0  distinta  de  x*.  Consideramos 

F(z*)-F{x*)=  [Z  F'{x)  dx  =  ^  F\x* +t(z* -x*))(z* -x*)dt  =  0 

Jx*  JO 

y  el  operador  J  —  F'(x*  +  t(z*  —  x*))  dt.  Teniendo  en  cuenta  que 

Jo 

l|/-r0J||  <  ||r0||||F'(xo)- J|| 

<  ||r0||  fl\\F'(x*  +  t(z*-x*))-Fl(x0)\\dt 

Jo 

<  6C  í  ((1  —  t)\\x*  —  x0||  +  í(||^*  —  £0||))  dt 

Jo 

9C  (  2  \ 

<  t(»+'5) 

<  1, 

puesto  que  CS9  <  2,  el  operador  J  es  inversible  y,  por  tanto,  x*  =  z*.  ■ 

4.1.2.  Accesibilidad 


Buscando  cierto  paralelismo  con  las  cuencas  de  atracción  vistas  en  las  figuras  3.6  y  3.7 


consideramos  ahora  la  otra  forma  experimental  de  estudiar  la  accesibilidad  de  un  método 
iterativo:  las  regiones  de  accesibilidad. 

En  la  figura  |4.1[  se  muestran  las  regiones  de  accesibilidad  de  la  solución  2  =  1  de  la  ecua¬ 
ción  compleja  F(z)  =  z3  —  1  =  0,  una  vez  fijado  el  dominio  complejo  [0.8, 1.6]  x  [—0.2, 0.2] 
que  conduce  a  que  C  =  6 1 1 .6  +  0.27 1 ,  para  los  métodos  de  Newton,  según  el  teorema  de 


Newton-Kantorovich,  y  de  Steffensen,  según  el  teorema  |4.1|  Notamos  que  las  regiones  están 
superpuestas.  Observamos  entonces  la  gran  diferencia  que  existe  entre  las  dos  regiones  de  ac¬ 
cesibilidad,  tal  y  como  ocurría  con  las  cuencas  de  atracción,  volviéndose  a  poner  de  manifiesto 
la  reducida  accesibilidad  del  método  de  Steffensen. 

Recordemos,  sección  |1.5.2|  del  capítulo  [lj  que  para  representar  gráficamente  la  región  de 
accesibilidad  para  el  método  de  Newton,  coloreamos  los  puntos  Xq  que  verifican  la  condición 
C692  <  |  del  teorema  de  Newton-Kantorovich.  Para  representar  gráficamente  la  región  de 
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Figura  4.1:  Regiones  de  accesibilidad  de  la  solución  z  =  1  de  la  ecuación  compleja  F{z)  = 
z3  —  1  =  0  para  los  métodos  de  Newton  (región  roja)  y  de  Steffensen  (región  verde),  según 
los  teoremas  de  Newton-Kantorovich  y  |4.1[  respectivamente. 


accesibilidad  para  el  método  de  Steffensen,  coloreamos  los  puntos  x0  que  verifican  las  dos 


condiciones  dadas  en  (4.4)  del  teorema  4.1 


Por  otra  parte,  si  comparamos  teóricamente  la  accesibilidad  de  ambos  métodos  mediante 

vemos 


los  dominios  de  parámetros  asociados  a  los  teoremas  de  Newton-Kantorovich  y  4.1 


claramente  en  la  figura  |4.2|  que  la  accesibilidad  del  método  de  Steffensen  se  reduce  con¬ 
siderablemente  con  respecto  a  la  del  método  de  Newton.  Notamos  que  las  regiones  están 
superpuestas. 

Recordemos,  sección  1.5.2  del  capítulo [lj  que  para  representar  gráficamente  el  dominio  de 
parámetros  del  método  de  Newton  asociado  al  teorema  de  Newton-Kantorovich,  coloreamos 


en  el  plano  xy  el  conjunto  de  puntos  {(x,y)  E 


9 

x  y 


<  |},  donde  x  =  9  e  y  =  C5. 


Para  representar  gráficamente  el  dominio  de  parámetros  del  método  de  Steffensen  asociado 
al  teorema  14. 1 1  coloreamos  en  el  mismo  plano  xy  el  conjunto  de  puntos  que  cumplen  las  dos 


condiciones  dadas  en  (4.4),  véase  la  figura  4.2 


4.2.  Método  predictor:  el  método  simplificado  de  New¬ 
ton 


Con  el  objetivo  de  aumentar  la  aplicabilidad  del  método  de  Steffensen,  vamos  a  construir, 
como  se  ha  indicado  en  la  introducción,  un  método  iterativo  híbrido  (predictor-corrector)  que 
nos  permita  localizar  puntos  de  salida  para  el  método  de  Steffensen  y  que,  a  partir  de  ellos, 
esté  garantizada  la  convergencia  del  método.  Para  ello,  tenemos  que  considerar  un  método 
predictor  apropiado.  Así,  consideramos  como  método  predictor  el  método  simplificado  de 


Newton  (4.1 ),  que  tiene  la  misma  accesibilidad  que  el  método  de  Newton,  pero  sin  la  necesidad 


de  tener  que  evaluar  derivadas  en  cada  paso  de  iteración.  Como  el  operador  F  es  derivable, 
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0.00  0.05  0.10  0.15 


Figura  4.2:  Dominios  de  parámetros  de  los  métodos  de  Newton  (región  roja)  y  de  Steffensen 
(región  verde)  asociados  a  los  teoremas  de  Newton- Kantorovich  y  4.1  respectivamente. 


dado  el  punto  de  salida  x0,  existirá  el  operador  F\x 0),  que  es  la  única  derivada  que  se  evalúa 
a  la  hora  de  aplicar  el  método  simplificado  de  Newton  (4.1). 


4.2.1.  Convergencia  semilocal 


Acabamos  de  ver  que  la  accesibilidad  del  método  de  Steffensen  es  peor  que  la  del  mé¬ 
todo  de  Newton.  Sin  embargo,  como  veremos  a  continuación,  la  accesibilidad  del  método 


simplificado  de  Newton  (4.1)  es  la  misma  que  la  del  método  de  Newton,  si  bien  tiene  menor 


velocidad  de  convergencia,  puesto  que  su  A-orden  de  convergencia  es  al  menos  lineal.  Esto  nos 
lleva  a  considerar  un  método  iterativo  híbrido  (predictor-corrector)  formado  por  los  métodos 


simplificado  de  Newton  (4.1)  y  de  Steffensen.  Así,  mediante  un  método  predictor  con  buena 


accesibilidad  y  un  método  corrector  con  buena  velocidad  de  convergencia,  obtendremos  un 
método  híbrido  con  características  similares  a  las  del  método  de  Newton. 


Comenzamos  viendo  que  el  método  simplificado  de  Newton  (4.1)  tiene  la  misma  accesibi¬ 


lidad  que  el  método  de  Newton.  Establecemos  entonces  bajo  qué  condiciones  para  el  punto 
de  salida  Zq  y  el  operador  F  podemos  garantizar  la  convergencia  del  método  simplificado  de 


Newton  (4.1)  a  una  solución  de  la  ecuación  F(x)  =  0.  Para  ello,  suponemos  que  se  cumplen 
las  siguientes  condiciones: 


(Hl)  ||F(z0)||<ú0, 

(H2)  existe  To  =  [F'^o)]-1  G  £(X,X),  para  Zo  G  ó,  y  es  tal  que  || To ||  <  do, 
(H3)  \\F'(x)-F'(y)\\<C\\X-yl  C>  0,  x,yeQ. 

A  partir  de  (H1)-(H3)  definimos  el  polinomio  cuadrático 

p(t)  =  -  tu  +  te[t0,t'}, 

Z  ÜQ 


(4.5) 
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donde  t*  <  t**  <  t',  y  denotamos  por  t*  y  t**  sus  dos  raíces  positivas.  Definimos  también  la 
función 

h(t)  —t  +  90p(t )  (4.6) 

y  consideramos  la  sucesión  {ín}  dada  por 


t0  —  0, 

tn+1  =  h(tn)  =tn  +  60p(tn),  n  >  0. 


Lema  4.2.  La  sucesión  (f.l)  converge  de  forma  creciente  a  t* . 


Demostración.  De  (4.7),  se  sigue 


(4.7) 


ti~t0  =  90p(t0)  >  0, 


h  -  t*  =  h(t0 )  -  h(t*)  =  tí(90)(t0  -  t*)  <  0, 

de  modo  que  íi  >  to  y  íi  <  t*.  Supongamos  que  t}.  >  tk-i  y  tk  <  t*,  para  k  —  1,  2 . . . ,  n  —  1. 
Entonces,  como  tn_ i  <  £*,  se  tiene  p(tn_ i)  >  0  y 

tn  tn— 1  ^oP(^n— l)  ^  0’ 


Además, 

tn  -  t*  =  h(tn-i)  -  h(t*)  =  h! (6>n_i)(ín_i  -  £*)  <  0. 

Por  tanto,  la  sucesión  {ín}  es  creciente  y  tn  <  t*,  para  todo  n  G  N.  Luego,  existe  í  =  1  ím tn . 
Ahora  bien,  como 

t  =  lím  tn+i  =  lím  (tn  +  90p(tn )) , 
tenemos  90p(t)  =  0,  de  donde  se  sigue  i  =  t* .  ■ 


Teorema  4.3.  Sean  X  un  espacio  de  Banach  y  F  :  Í2  C  X  — >•  X  un  operador  una  vez 
continuamente  diferenciable  Fréchet  definido  en  un  dominio  abierto  convexo  no  vacío  Í2. 
Supongamos  que  se  verifican  las  condiciones  (H1)-(H3)  y  que  se  satisfacen 


cs0e20  < 


(4.8) 


y  B{zQ,t*)  C  Vt,  donde  t*  =  1  ■  Entonces,  la  ecuación  F(x)  =  0  tiene  una  solución 

z*  y  el  método  simplificado  de  Newton  (f.l)  converge  a  z*  empezando  en  zq.  Además,  zn,  z*  G 
B(zo,t*),  para  todo  íigN.  Por  otra  parte,  si  CSo9q  <  \,  z*  es  la  única  solución  de  F(x)  =  0 

en  B(xo,t**)  fl  fl,  donde  t**  =  1+^1Cq^5—  ■ 

Demostración.  En  primer  lugar,  consideramos  z\  =  zq  —  roE(^o).  En  este  caso, 


¿i  ~  z0\\  —  ||r0i?(-o)||  <  9050  <  t±  —  to  <  t* . 


Luego,  z\  G  B(zo,t*)  C  ó  y  podemos  definir  z2  =  Z\  —  r0i?(2;1). 
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Ahora, 


F(zi)  =  F(z¡)  -  F(z„)  -  F'(z„)(z¡  -  z0) 

-  r 

Jz0 


y 


de  forma  que 


(F'(u)  -  F'(z0 ))  du 

í  ( F'(zo  +  t(z!  -  z0))  -  F'(z0 ))  dr(zi  -  z0) 
Jo 


IITOII<^IE-;oII2<§(í.-ío)2, 


II  II  <" 

11*2  -2l||  < 


Teniendo  en  cuenta  que  ¿2  —  ó  =  #o ip(íi)  =  °  '  *,  se  sigue 

11^2-21 1|  <  Í2-Í1, 

11-2-2  —  -o||  <  ||-2  —  -l||  +  ||-1  ~  -o||  <  ¿2  ~  ¿0  <  í*- 

Luego,  z2  G  B(z0,t*)  C  ó  y  podemos  definir  z3. 

Ahora,  a  partir  de 

F(zn)  =  F(zn)  -  F(zn- 1)  -  F'(z0)(zn  -  zn-i) 

P  Zn 

=  /  (F'(u)  -  F\z0 ))  du 

J  Zn- 1 

f  {F  (— n— i  T  ^"(Ai  Ai— i))  F  (—o))  dT(zn  Ai— l)j 

Jo 


y 


se  tiene 


puesto  que 


P(tn)  P(tn)  P(tn—l)  T  (f n  J"n—  l) 

t'o 


'tn  —  1 


(p'(«)  -p'(ío))  du 


í  (p'(tn- 1  +  r{tn  -  tn-i))  -  pito))  dr(tn  -tn- 1) 
^0 


C  (  (Ítt,—  !  ¿o)  “1“  2  tn—l)  )  (^n  ¿n— l)? 


||-F(zn)||  <  P(ín),  VíIGN, 


||-^1(— n)||  —fe  (||Ai— 1  ío||  T  t||Ai  Ai— 1||)  (ÍT||zn  Ai— 1 

Jo 


<  C  (  (tn_i  -  ío)  +  -(í„  -  tn—\) )  (ín  -  ín_i). 


Entonces, 


Ai— 1||  A  ^0 P(tn)  tn  tn_  1 
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y,  por  tanto,  como  la  sucesión  {£„.}  es  de  Cauchy,  se  deduce  que  la  sucesión  {zn}  también 
lo  es  y,  en  consecuencia,  {zn}  converge  a  z*  G  B(zo,t*).  Veamos  que  es  solución  de  la 
ecuación  F(x)  =  0.  Hemos  probado  que  ||F(^n)||  <  p(tn),  de  manera  que  F(z*)  =  0  se  sigue 
por  continuidad. 

Finalmente,  suponemos  que  existe  otra  solución  y*  G  B(zq,  t**)  flD  de  la  ecuación  F(x)  =  0 
distinta  de  z*.  Consideramos 


F(y*)-F{z*)=  ["  F'(x)  dx  —  C  F\z*  +  t(y*  -  z*))(y*  -  z*)  dt  =  0 
Jz*  Jo 

y  el  operador  J  —  F'(z*  +  t(y*  —  z*))  dt.  Teniendo  en  cuenta  que 

Jo 

||/-r„j||  <  liroHHF'^o)- j|| 

<  llñll  ['  l|V(*-*  +  t(y *  -  V))  -  F'(*,)||  dt 

Jo 

<  d0 cf  ((1  -  t)\\z*  -  z0\\  +  t\\y*  -  z0\\)  dt 

Jo 


< 


Cdn 


( t**  +  t *) 


=  1, 


vemos,  por  el  lema  de  Banach  (lema  1.22),  que  el  operador  J  es  inversible  y,  por  tanto, 


4.2.2.  Accesibilidad 


En  la  figura  T3  se  muestran  las  regiones  de  accesibilidad  de  la  raíz  z  =  1  de  la  ecuación 
compleja  F(z)  =  z3  —  1  =  0,  una  vez  fijado  el  dominio  complejo  [0.8, 1.6]  x  [—0.2,  0.2]  que 


conduce  a  que  C  =  6|  1.6  +  0.2i\,  para  los  métodos  simplificado  de  Newton  (4.1),  según  el 
teorema  4.3,  y  de  Steffensen,  según  el  teorema  4.1  Notamos  que  las  regiones  están  super¬ 


puestas.  Observamos  entonces  que  ocurre  lo  mismo  que  cuando  comparábamos  las  regiones 
de  accesibilidad  de  los  métodos  de  Newton  y  de  Steffensen:  la  gran  diferencia  entre  ambas 
regiones.  De  hecho,  las  regiones  de  accesibilidad  para  los  métodos  de  Newton  y  simplificado 


de  Newton  (4.1)  son  las  mismas.  Esto  nos  indica  que  el  dominio  de  puntos  de  salida  para 
obtener  una  aproximación  de  la  raíz  z  =  1  de  la  ecuación  compleja  F(z)  =  z3  —  1  =  0  es 


mucho  mayor  para  el  método  simplificado  de  Newton  (4.1)  que  para  el  de  Steffensen. 


Por  otra  parte,  si  representamos  gráficamente  el  dominio  de  parámetros  del  método  sim¬ 


plificado  de  Newton  (4.1)  asociado  al  teorema  4.3,  figura  4.4,  vemos,  como  es  obvio,  que  es 


el  mismo  que  el  del  método  de  Newton  asociado  al  teorema  de  Newton-Kantorovich,  puesto 
que  las  condiciones  de  convergencia  impuestas  en  ambos  teoremas  son  las  mismas.  Notamos 
que  las  regiones  están  superpuestas.  Por  lo  tanto,  si  comparamos  la  accesibilidad  de  los  mé¬ 


todos  simplificado  de  Newton  (4.1)  y  de  Steffensen,  desde  el  punto  de  vista  teórico  de  los 


dominios  de  parámetros  asociados  a  los  teoremas  T3  y  4T,  concluimos  lo  mismo  que  antes: 
la  accesibilidad  del  método  de  Steffensen  se  reduce  considerablemente  con  respecto  a  la  del 


método  simplificado  de  Newton  (4.1). 
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Figura  4.3:  Regiones  de  accesibilidad  de  la  solución  z  =  1  de  la  ecuación  compleja  F(z)  = 
z3  —  1  =  0  para  los  métodos  simplificado  de  Newton  (región  roja)  y  de  Steffensen  (región 
verde),  según  los  teoremas  4.3  y  4.1,  respectivamente. 


Parece  entonces  claro  que  podemos  aprovechar  la  accesibilidad  del  método  simplificado 
de  Newton  (4.1)  para  predecir  puntos  de  salida  para  el  método  de  Steffensen  que  garanticen 
la  convergencia  de  éste  al  empezar  en  ellos. 


4.3.  Método  iterativo  híbrido  (predictor-corrector) 


A  partir  de  lo  visto  anteriormente,  ahora  nos  planteamos  construir  una  modificación  del 
método  de  Steffensen  que  mejore  su  accesibilidad,  utilizando  para  esto  el  método  simplificado 


de  Newton  (4.1). 


4.3.1.  Construcción  del  método 


Como  se  observa  en  la  figura  |4~4[  el  dominio  de  parámetros  del  método  de  Steffensen  está 
contenido  en  el  dominio  de  parámetros  del  método  simplificado  de  Newton  (4.1).  Por  tanto, 


las  condiciones  exigidas  al  método  de  Steffensen  para  garantizar  su  convergencia  semilocal 


son  evidentemente  más  restrictivas  que  las  exigidas  al  método  simplificado  de  Newton  (4.1). 


Tratamos  entonces  de  asegurar  que,  para  un  par  inicial  (Úq,  #o)  que  satisfaga  la  condición 


(4.8),  es  decir  que  esté  dentro  del  dominio  de  parámetros  del  método  simplificado  de  Newton, 


obtengamos  un  par  (5,  6)  que  satisfaga  las  dos  condiciones  dadas  en  (4.4),  después  de  realizar 


un  cierto  número  N0  de  iteraciones  con  el  método  simplificado  de  Newton,  de  manera  que 
estemos  en  condiciones  de  poder  garantizar  la  convergencia  del  método  de  Steffensen  al 


empezar  en  la  iteración  N0  que  se  obtiene  mediante  el  método  simplificado  de  Newton  (4.1) 


De  este  modo,  se  puede  considerar  el  par  (5n0,6n0)  asociado  a  la  iteración  N0  obtenida  con 


el  método  simplificado  de  Newton  (4.1)  como  el  par  (5,6)  asociado  a  la  iteración  inicial  xq 
del  método  de  Steffensen. 
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Figura  4.4:  Dominios  de  parámetros  de  los  métodos  simplificado  de  Newton  (región  roja)  y 
de  Steffensen  (región  verde)  asociados  a  los  teoremas  4.3  y  4.1,  respectivamente. 


Nuestro  objetivo  principal  es  entonces  construir  una  sencilla  modificación  del  método  de 
Steffensen  de  manera  que  este  método  converja  al  empezar  en  los  mismos  puntos  de  salida  que 


el  método  simplificado  de  Newton  (4.1).  Consideramos  entonces  el  método  iterativo  híbrido 


(predictor-corrector)  dado  por  el  siguiente  algoritmo 


dado  zo  en  íl, 

zi+ 1  =  Zi  -  [ F'(z0)}~1F(zi ),  i  =  0, 1, . . . ,  N0  -  1, 

Xq  =  Zn0 , 

xn+ 1  =  xn  -  [xn>xn  +  F(xn);  F]-1F(x„),  n  >  0, 


(4.9) 


donde  z0  satisface  (4.8),  mientras  que  x0  =  z^0  satisface  (4.4).  Para  que  este  algoritmo  sea 
convergente  nos  planteamos  dos  cuestiones: 


1.  Localizar  z0  de  manera  que  el  método  predictor,  el  método  simplificado  de  Newton 
(4.1),  sea  convergente. 


2.  Utilizando  la  convergencia  del  método  predictor,  calcular  un  valor  IVo  tal  que  Zn0  sea 
considerado  como  punto  de  salida  del  método  corrector,  el  método  de  Steffensen,  de 
manera  que  podamos  asegurar  la  convergencia  del  método  de  Steffensen  saliendo  desde 

24)  =  A/Vo- 


La  idea  es  usar  el  método  simplificado  de  Newton  (4.1)  durante  un  número  finito  de  pasos 
N0  hasta  que  znq  =  xq  cumpla  las  condiciones  dadas  en  (4.4)  y  aplicar  después  el  método 
de  Steffensen  en  vez  del  método  simplificado  de  Newton  (4.1).  La  clave  del  problema  reside 
entonces  en  garantizar  la  existencia  de  N0. 
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4.3.2.  Convergencia  semilocal  del  método 


A  continuación,  vamos  a  estudiar  la  convergencia  semilocal  del  método  híbrido  (4.9). 
Necesitamos  entonces  conocer  la  evolución  de  los  parámetros  asociados  a  las  aproximaciones 
que  vamos  obteniendo  como  iteraciones  del  método  simplificado  de  Newton  (4.1),  para  lo  que 
nos  apoyamos  en  el  siguiente  resultado. 


Teorema  4.4.  En  las  condiciones  del  teorema  4-3,  consideramos  el  polinomio  (4-5)  y  sean  t* 
y  t**  sus  dos  raíces  reales  positivas  y  tales  que  t*  <  t** .  Entonces,  para  el  método  simplificado 
de  Newton  (4-1),  se  obtienen  las  siguientes  cotas  de  error: 

((í**  -  t*)t*)n+1 


(i)  Si  t*  <  t* 


_ <r_t  <  t*(t**-t*)(t*ce0y 

1  -  ( t*)n+1  n  t**  -  t*(t*C90)n 


(ii)  Si  t*  =  t* 


-  )  t*  <  f  -  tn  <  t* 


Demostración.  Demostramos  en  primer  lugar  el  apartado  (i).  A  partir  de  (4.5),  como 
t*  <  t**,  tenemos 

p(t)  =  3(c-t)(t"-t). 

Si  denotamos  an  =  t*  —  tn  y  bn  =  t**  —  tn,  para  todo  n  >  0,  entonces  p(tn)  =  %anbn , 

p'^ o)  -  y 


an-¡-i  —  t  ín+i  —  t  tn  9op(tnj  —  ar 


Cd  r 


dnbni 


ce  n 


Como 


y  la  función 


bn+l-C*  tn+1-t**  tn  9oP(tn)-bn  2  anbn. 

dn+l  =  Qn  2  —  C90(t**  —  tn) 
bn+ 1  bn  2  -  C90(t*  -  tn) 

2  -  C90(t**  -  t ) 


fi(t)  = 


2  —  C90(t*  —  t ) 


es  estrictamente  creciente,  entonces 

t 


t* 


=  ó(0)  =  Ó(¿o)  <  ^(t)  <  VKO  =  C90t*, 


de  manera  que 


dn+l 

bn+1 


°PW„)  <  (Ato  <  AU(f)2  <  ■  ■  ■<  Amo"1  =  Cce0t‘) 


*\n+ 1 


bn- 


n—í 


t* 


^n+1 

bn-\- 1 


T^( tn )  >  ^V’(ío)  >  “í^(ío)2  >  ■  ■  ■  >  ^(toT+1 

On  On  On- 1  Oq 
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Como  bn+ 1  =  (£**  —t*)  +  an+i,  obtenemos 

(í**  -r)(r)n+2 


^£**^n+2  _  ^*^n+2 


<  t*  -  ¿n+l  < 


í*(í**  -t*)(t*ce0)n+1 

t**  _t*(t*C90)n+ 1 


En  segundo  lugar  vemos  (m).  Partiendo  de  (4.5),  si  t*  =  t**,  entonces  an  =  bn  y  p{tn)  = 


C  2  , 

— a„,  de  manera  que 


«n+1  1 

-  =  1 - 7Tan- 

Clr.  2 


Ahora,  teniendo  en  cuenta  que  la  función 

<d(¿)  =  1  - 

es  estrictamente  creciente,  se  sigue  que  \  =  (p(t0)  <  cp(t )  <  =  1  y,  como  an+1  =  cp(tn)an, 

entonces 

an+ 1  <  an  <  ■  ■  ■  <  a0  <t*  -  t0  =  t*, 

1  /l\n+1  /ló”"*"1 


ny^1  * 

an+i  >  2an  >  ■■■  >  (jJ  «°  = 


En  consecuencia, 


1  \  n+1 


r  <  r  -  tn+i  <  r. 


Notemos  que  a  partir  del  resultado  anterior  resulta  evidente  que  el  método  simplificado  de 


Newton  (4.1)  tiene  al  menos  convergencia  lineal. 


Método  predictor:  el  método  simplificado  de  Newton 


Consideramos  la  situación  inicial  a  partir  del  método  simplificado  de  Newton  (4.1).  Dada 


la  aproximación  inicial  z0,  partimos  del  par  (50,$o)  definido  a  partir  de  (Hl)  y  (H2): 

llñll  =  l|[fVo)]"Ill  <  «o  y  ||F(*>)II<V 


Para  la  convergencia  del  método  debe  verificarse  la  condición  (4.8): 

CS„620  < 

Iterando,  se  van  definiendo  los  pares  (ón,  9n),  a  partir  del  cumplimiento  de  la  condiciones 
(Hl)  y  (H2),  de  modo  que 

C  C2 

H-E(^n)||  V  p{tn)  —  5n  4»  =  8n  Vr-  ~¡^~Clnbn  =  C8n, 


donde  an  —  t*  —  tn  y  bn  —  t**  —  tn,  siendo  t*  y  t**  (t*  <  t**)  las  dos  raíces  positivas  de  (4.5). 


Por  el  teorema  4.4,  tenemos 


cón  =  cP(tn )  <  —  —4  (t*ce0y 


2  t**-t*(t*ce 0y 

Ct*t**yJl-2Cóo0% 

e0  (t**  -t*(t*ce0)n) 
ct*t**{t*ce  0)n 

90(t**  -  t*(t*C90)n) 


(i t*C90)n 
(1  -t*C90). 


(4.10) 
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A  continuación,  expresando  9n  en  función  de  90  y  considerando 

\\I-T0F'(zn)\\  <  \\T0\\\\Fl(zo)-F,(zn)\\<C90\\z0-zn\\<C90t*, 

obtenemos 

||r„||  =  ||  [F\zn)Yl  ||  <  9n,  donde  9n  =  - — ^  =  9. 

1  -  OC/Qt 

Con  lo  que,  tras  aplicar  este  método,  obtenemos  el  par  ( ón ,  9n )  =  (ón,  9)  para  algún  n  G  N. 


Método  corrector:  el  método  de  Steffensen 

El  par  (ón,  9n)  =  (ón,  9)  debe  verificar  ahora  las  condiciones  de  convergencia  dadas  en 
(4.4)  para  el  método  de  Steffensen: 


CS9  <  2  y  £ób2  <  -, 

donde  ó  =  ón,  b  =  0J^,se  y  £  =  C  (l  +  .  Por  tanto,  sustituyendo  los  parámetros  ó  y  9  del 

método  predictor  en  (4.4),  tenemos: 

•  Si  CS9  <  2,  entonces  C5n  <  |, 

•  Si  dób2  <  |,  entonces  \  >  £5nb2  —  C  (l  +  Sn  ^  ,  que  es  equivalente  a 


5 92(C5n)2  -  40(3  +  2 9){C5n)  +  4  >  0 


y  se  verifica  si 


Luego, 


C5n  <  P,  donde  P  = 


C5n  <  mín  \-,P\  = 


2(3  +  2 9)9  -  4V92  +  30  +  1 
502  ' 

P  si  0  <  2.5303  . . . 

2 


0 


si  0>  2.5303... 


(4.11) 


Definición  de  Nn 


Ahora  vamos  a  definir  A^  de  manera  que  indique  cuando  se  da  el  salto  del  método  predictor 
al  método  corrector.  Notemos  que  la  sucesión  {ún}  es  decreciente,  con  lo  que  buscamos  el 
primer  valor  de  n  en  (4.10)  que  verifique  (4.11). 


Si  0  <  2.5303  . . .,  entonces 

C5n< 


Ct*t**(C90t* 


(1  —  C90t*)  <  P. 


90(t**  -  t*(t*C90) 

Tomando  logaritmos,  encontramos  un  valor  N0  G  N,  de  manera  que  el  par  (Avo,0jvo) 
satisfaga  las  dos  condiciones  de  convergencia  dadas  en  (4.4)  para  el  método  corrector. 
Así,  obtenemos 

,  (  P90t**  \ 

log 


N0> 


P(P90  +  Ct**(l-t*C90)) 


log  (t*C90) 
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Luego 


No  =  1  + 


log 


P60t* 


t*(P90  +  Ct**{l-C90t*)) 


\og(C90t* 


Si  9  >  2.5303  . . .,  entonces 

CSn< 


cft"it’ce„)n  _  2 

e0(t"  -f(fceaYy  01  o' 


Tomando  de  nuevo  logaritmos  y  procediendo  como  en  el  caso  anterior,  encontramos 
un  valor  N0  G  N,  de  manera  que  el  par  (<5v0,  #jv0)  satisfaga  las  dos  condiciones  de 


convergencia  dadas  en  (4.4)  para  el  método  corrector.  Así,  obtenemos 

2 e0t**  N 


No  —  l  + 


log 


fi*(290  +  C9t**(l  -C90t*))/ 
log(C90t*) 


Por  tanto,  podemos  asegurar  que  el  método  corrector  es  convergente  partiendo  del  punto 
xo  =  zn0. 

A  partir  de  los  comentarios  y  resultados  previos,  queda  probado  el  siguiente  teorema  de 


convergencia  semilocal  para  el  método  iterativo  híbrido  (predictor-corrector)  dado  en  (4.9). 


Teorema  4.5.  Sean  X  un  espacio  de  Banach  y  F  :  ó  C  X  — >•  X  un  operador  una  vez 
continuamente  diferenciable  Fréchet  definido  en  un  conjunto  abierto  convexo  no  vacío  ó. 
Suponemos  que  se  satisfacen  las  condiciones  (H1)-(H3)  y  que  B(z0,t*)  C  ó,  donde  t*  es  la 
menor  raíz  positiva  del  polinomio  (4.5).  Si  además  CSo9(  <  entonces  existe  N0  G  N  de 


forma  que  el  método  (4-9)  es  convergente  con 


Nri  = 


1  + 


log 


PON* 


t*{P60  +  Ct**(l-C60t*)) 


1  + 


log 


log  (C0Qt* 
2 60t** 


t*(260  +  C6t**(l-C60t*)) 


log  (C60t*) 


y6  = 


9n 


1  -  C9nt* 


si  9  <  2.5303 


(4-12) 


si  9  >  2.5303 


4.4.  Aplicación 

En  principio,  la  aplicabilidad  del  método  de  Steffensen  es  menor  que  la  del  método  simpli¬ 


ficado  de  Newton  (4.1 ).  Veamos  que  esto  es  así  en  la  siguiente  aplicación,  donde  comprobamos 
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que  no  podemos  aplicar  el  método  de  Steffensen  para  aproximar  una  solución  del  problema 
discreto,  que  surge  de  discretizar  una  ecuación  integral  no  lineal  de  Hammerstein,  porque  no 


se  cumplen  las  condiciones  de  convergencia  del  teorema  4.1  Sin  embargo,  apoyándonos  en  el 


método  híbrido  (4.9),  vemos  que  podemos  aplicar  el  método  de  Steffensen  a  partir  de  cierta 
iteración. 


Consideramos  la  siguiente  ecuación  integral  no  lineal  mixta  de  tipo  Hammerstein 


x(s)  —  1  +  [  G(s,t)  x(t)2  dt,  se  [0,1], 
Jo 


(4.13) 


donde  x  €  C[0, 1],  t  €  [0, 1]  y  el  núcleo  G  es  la  función  de  Green  en  [0, 1]  x  [0, 1]. 


A  continuación,  usamos  un  proceso  de  discretización  que  transforma  (4.13)  en  un  problema 


finito  dimensional,  tal  y  como  se  hizo  en  la  sección |I.6.1[  de  manera  que  obtenemos  el  siguiente 
sistema  de  ecuaciones  no  lineales: 


F(x)  =x  — 1  — Ax  =  0,  F  : 


(4.14) 


donde 


X  =  {Xi,X2, 


,X8) 


1  =  (1,1,...,1)T,  A={a. 


X  =  X,  ,  X 


1,  ) 


X 


2 \T 


Además  ,  F'(x)  =  I  —  2Adiag{x}. 

Eligiendo  como  punto  de  salida  z0  =  (1.7, 1.7, . . . ,  1.7)T  y  la  norma  del  máximo,  obte¬ 
nemos  <50  =  0.6713  . . .,  90  —  1.6549  . . .,  C  —  0.2471 . . .,  C5o0l  =  0.4543 ...  <  |.  Por  tanto, 


podemos  aplicar  el  método  simplificado  de  Newton  (4.1)  para  resolver  el  sistema  (4.14),  pues¬ 


to  que  se  verifica  la  condición  (4.8)  del  teorema  4.3  Por  contra,  no  podemos  aplicar  el  método 


de  Steffensen,  ya  que  no  se  verifica  la  segunda  condición  de  (4.4)  del  teorema  4.1,  puesto  que 


Í5b2  =  0.9286...  >  -, 


donde  5  =  50,  b  =  1.9182  . . .  y  í  =  0.3759  . . . 

Como  el  método  simplificado  de  Newton  (4.1)  es  convergente  por  el  teorema  4.3  lo  aplica¬ 
mos  para  obtener  la  aproximación  numérica  x*  =  (x^,  x?¿,  ■  ■  ■ ,  £g)T  de  la  solución  del  sistema 

después  de  20  iteraciones  y  usando  como  criterio  de  parada 

G||  obtenidos  con  el  mismo 


(4.14)  y  mostrada  en  la  tabla  4.1 
||zn-Zn-i||  <  HT16.  En  la  tabla 
criterio  de  parada.  Notemos  que  el  vector  dado  en  la  tabla  |4.1|  es  una  buena  aproximación 


4.2  se  muestran  los  errores  ||zr 


de  la  solución  del  sistema  (4.14),  puesto  que  ||F(x*)||  <  constante  x  10  16.  Mostramos  la 
sucesión  {||F(zn)||}  en  la  tabla  4.2 


i 

x* 

i 

x* 

i 

i 

x¡ 

1 

1.012239... 

3 

1.118079... 

5 

1.159804... 

7 

1.058428... 

2 

1.058428 . . . 

4 

1.159804... 

6 

1.118079... 

8 

1.012239. . . 

Tabla  4.1:  Aproximación  de  la  solución  x*  de  (4.14) 


Por  otra  parte,  si  aplicamos  el  método  híbrido  (4.9)  para  aproximar  la  solución  dada  en 
la  tabla  4.1  con  el  mismo  punto  de  salida,  sólo  necesitamos  calcular  el  valor  de  N0,  mediante 
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n 

|| zn  - 

x*|| 

iia* 

n)  || 

0 

6.8776 . . 

x  10"1 

6.7130... 

x  lO”1 

1 

6.1560.. 

x  10“2 

4.6960 . . 

x  10~2 

2 

1.1811.. 

x  10“2 

8.9776 . . 

x  10“3 

3 

2.0931.. 

x  10~3 

1.5942. . 

x  10“3 

4 

3.7465.. 

x  10~4 

2.8588... 

x  10-4 

5 

6.6908.. 

x  10~5 

5.0952... 

x  10“5 

19 

2.2532... 

x  10“15 

1.7180... 

x  10~15 

Tabla  4.2:  Errores  absolutos  obtenidos  con  el  método  simplificado  de  Newton  y  {||F(zn)||} 


el  teorema  4.5,  teniendo  en  cuenta  el  valor  9  =  5.4777. . .  Si  nos  fijamos  en  la  fórmula  (4.12), 
obtenemos  Nq  =  1.  Por  tanto,  después  de  una  iteración  del  método  simplificado  de  Newton 
(4.1),  podemos  aplicar  el  método  de  Steffensen,  obteniendo  la  aproximación  numérica  de  la 
solución  dada  en  la  tabla  14.11  tras  realizar  cuatro  iteraciones  más  con  este  último  método. 
En  la  tabla  4.3  se  muestran  los  errores  ||xn  —  x*||  cuando  usamos  el  criterio  de  parada 
||xn  —  xn_! ||  <  10”16,  así  como  la  sucesión  {||F(xn)||}. 


n 

||xn 

-x*|| 

||F(x 

n)  || 

0 

6.8776 . 

..  x  10”1 

6.7130... 

x  10~4 

1 

6.1560. 

. .  x  10-2 

4.6960 . . . 

x  10“2 

2 

8.2751. 

. .  x  10~4 

6.3230... 

x  10~4 

3 

1.4582 . 

..  x  10-7 

1.1158... 

x  10~7 

4 

4.4982 . 

.  x  10"15 

3.4428 . . . 

x  10~15 

Tabla  4.3:  Errores  absolutos  obtenidos  con  el  método  híbrido  (4.9)  y  {||F(xn)||} 


Capítulo  5 

Situación  (no)-diferenciable 


El  estudio  realizado  en  el  capítulo  anterior  se  restringe  a  la  resolución  de  ecuaciones 
F(x)  =  0  en  las  que  el  operador  F  es  diferenciable  Fréchet.  Evidentemente,  una  característica 
que  tiene  el  método  de  Steffensen  es  que  no  necesita  que  el  operador  F  sea  diferenciable 
Fréchet,  simplemente  necesita  que  exista  una  diferencia  dividida  definida  en  el  dominio  Í2. 

Habitualmente,  para  probar  la  convergencia  semilocal  del  método  de  Steffensen,  se  impo¬ 
nen  las  siguientes  dos  condiciones  básicas  ( CP )  ¡3 )  0 ) : 


(I)  Dados  dos  puntos  cualesquiera  x,  y  G  O,  distintos,  existe  la  diferencia  divi¬ 
dida  de  primer  orden  [x,  y,  F], 

(II)  La  diferencia  dividida  verifica  la  condición 

II [x,y,F\  -  [w,u;F]||  <  K(\\x-u\\  +  ||y  —  v||),  (5.1) 


con  K  >  0,  x,  y,  u,  v  G  O,  x  ^  y  y  u  ^  v. 


La  condición  (5.1)  se  puede  suavizar  considerando  la  condición 


II [x,y,F]  -  [u,v;F] ||  <  K(\\x-u\\p  +  ||?/-u||p), 


(5.2) 


con  K  >  0,  p  G  (0,1],  x,y,u,v  G  O,  x  ^  y  y  u  ^  v.  Las  condiciones  (5.1)  y  (5.2)  dicen 
que  la  diferencia  dividida  de  primer  orden  es,  respectivamente,  Lipschitz  continua  en  Q  y 
(K,  p)-Hólder  continua  en  Q. 

Si  ahora  consideramos  una  diferencia  dividida  de  primer  orden  para  la  que  existe  una 
función  uj  :  M+  x  M+  — y  M+  no  decreciente  en  sus  dos  argumentos  y  tal  que 


ll(^,K-F]  -  [u,v;F]||  <  w(l|i-«ll,  lls-i'll). 


(5.3) 


con  x,  y,  u,  v  G  0,  x  ^  y  y  u  ^  v,  es  claro  que  obtenemos  como  casos  particulares  las 
condiciones  (5.1)  y  (5.2)  si  u(s,t)  =  K(s  +  t)  o  u j(s,t)  =  K(sp  +  tp),  respectivamente. 
En  estos  casos,  como  <u(0,0)  =  0,  F  es  diferenciable  (véase  [27j).  Así,  los  resultados  de 
convergencia  semilocal  para  el  método  de  Steffensen  dados  habitualmente  exigen  veladamente 
que  el  operador  F  sea  diferenciable. 

En  este  capítulo  nos  planteamos  la  obtención  de  un  resultado  de  convergencia  semilocal 
para  el  método  de  Steffensen  cuando  se  aplica  a  ecuaciones  en  las  que  el  operador  F  puede 
ser  no  diferenciable.  Para  ello,  consideramos  las  condiciones  (I)  y  (5.3)  teniendo  en  cuenta 
que  o;(0,  0)  ^  0  si  el  operador  F  es  no  diferenciable. 
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Por  otra  parte,  dada  la  generalidad  de  las  condiciones  de  convergencia  que  vamos  a  con¬ 
siderar,  veremos,  a  partir  del  dominio  de  parámetros  asociado  al  resultado  de  convergencia 
semilocal,  que  la  accesibilidad  del  método  de  Steffensen  va  a  ser  restrictiva  en  determina¬ 
das  condiciones.  Para  solventar  esta  dificultad,  construiremos  un  método  iterativo  híbrido 
(predictor-corrector) . 

En  la  sección  |5.1|  obtenemos  un  resultado  de  convergencia  semilocal  para  el  método  de 
Steffensen  que  permite  aplicar  este  método  a  la  resolución  de  ecuaciones  con  determinados 
operadores  no  diferenciables.  Para  ello,  utilizamos  la  técnica  de  demostración  de  la  convergen¬ 
cia  semilocal  ya  vista  en  el  capítulo  [4|  basada  en  relaciones  de  recurrencia,  que  proporciona 
novedosos  resultados  acerca  de  la  convergencia  semilocal.  Después,  analizamos  el  dominio 
de  parámetros  asociado  al  resultado  obtenido,  observando  que  es  mejorable  en  determinadas 
situaciones.  En  la  sección  |5.2|,  pensando  en  la  construcción  de  un  método  iterativo  híbrido 


(predictor-corrector)  que  mejore  la  accesibilidad  del  método  de  Steffensen  y  que  no  utilice 
derivadas  en  su  algoritmo,  obtenemos  un  nuevo  resultado  de  convergencia  semilocal  en  las 


mismas  condiciones,  (I)  y  (5.3),  para  el  método  simplificado  de  Steffensen,  cuyo  algoritmo  es 


dado  en  O, 

zn+i  =  zn  -  [so,  Jo  +  -F(jo);  n  >  0, 


(5.4) 


y  que  utilizamos  como  método  predictor  en  el  método  híbrido.  Vemos  que  el  dominio  de 
parámetros  de  este  método  es  menos  restrictivo  que  el  del  método  de  Steffensen.  Así,  en  la 
sección  5.3,  construimos  un  método  iterativo  híbrido  (predictor-corrector)  que  se  beneficia 


del  buen  dominio  de  parámetros  del  método  simplificado  de  Steffensen,  el  método  predictor, 
y  de  la  velocidad  de  convergencia  del  método  de  Steffensen,  el  método  corrector.  Terminamos 


con  la  sección |5.4[  donde  vemos  dos  aplicaciones  en  las  que  se  aproximan  las  soluciones  de  dos 
sistemas  no  lineales,  uno  diferenciable  y  otro  no  diferenciable,  mediante  el  método  híbrido 
previamente  construido,  pero  que  no  se  pueden  aproximar  mediante  el  método  de  Steffensen. 


5.1.  Método  corrector:  el  método  de  Steffensen 

5.1.1.  Convergencia  semilocal 

Tal  y  como  hemos  dicho  en  el  capítulo  anterior,  resulta  evidente  que,  en  el  estudio  de  la 
convergencia  de  la  sucesión  {xn}  definida  por  el  método  de  Steffensen,  existirán  todas  las 
diferencias  divididas  de  primer  orden  [xk,Vk',F],  salvo  que  Xk  =  Vk  =  %k  +  F(xk),  en  cuyo 
caso  resulta  evidente  que  xy.  es  una  solución  de  la  ecuación  F(x)  =  0  y,  en  este  caso,  tenemos 
xn  =  Xk  para  todo  n  >  fc,  luego  la  sucesión  {xn}  es  convergente  a  Xk  =  x*  solución  de 
F(x)  =  0. 

Comenzamos  con  un  lema  técnico  que  utilizamos  posteriormente. 

Lema  5.1.  Sea  {xn}  la  sucesión  dada  por  el  método  de  Steffensen.  Si  xm-\  xm  con 
xm_i ,  xm  G  ó,  entonces 

F^Xjf)  {\xmpxm-. i,  E]  Am_fj  fxm  xm—\f  donde  Am_i  xm—\  T  E(xm_i),  E]. 

Demostración.  A  partir  de  la  sucesión  dada  por  el  método  de  Steffensen  se  sigue 
F{xm—\j  T  [xm_i ,  xm—\  T  F {xm—\ ) ,  E]  ( xm  xm—i )  0, 
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de  manera  que 

F{xm)  = 


F(xm)  F[xm—  l)  [Xm—ljXm—1  “I-  F(xm—f) ,  F]  [xm  Xm—\) 

[Xm .)  Xm—  1 ;  F]  ( Xm  ÍCm_i)  [^m—1  i  *^m— 1  “I”  F{xm—  i) ,  F ]  ( Xm  Xm—\  ) 
Xni  1 . T]  Am_i)  (xm  ÍCm_i).  I 


A  continuación,  presentamos  un  resultado  de  convergencia  semilocal  para  el  método  de 
Steffensen.  Para  ello,  dados  x0,  Xq  +  F(x0)  G  Í2,  notemos  que  x0  ^  x0  +  F(x o),  ya  que  en  otro 
caso  xo  es  una  solución  x*  de  F(x)  =  0  y  xn  =  x*,  para  todo  n  G  N.  Suponemos  las  siguientes 
condiciones: 


{Ci)  II^MII  <5, 

(C2)  existe  Aq1  =  [x0,x0  +  F(x0);  F}^1  G  C(X,X),  para  x0  G  Í2,  y  es  tal  que 

Po1H<A 

(C'a)  ||[a,Z/;-F]  -  [u^-FlII  <  u(\\x  -  «II,  II?/  -  u||);  x,y,u,v  E  D;  x  ±  y,  u  ±  v, 
donde  u  :  M+  x  M+  — y  M+  es  una  función  continua  no  decreciente  en  los  dos 
argumentos. 


Teorema  5.2.  Sean  X  un  espacio  de  Banach  y  F  :  Í1  C  X  — y  X  un  operador  no  lineal  defi¬ 
nido  en  un  dominio  abierto  convexo  no  vacío  ó.  Suponemos  que  se  cumplen  las  condiciones 
(C'i)-(C'3).  Si  la  ecuación 


t  = 


¡38{  1  —  /3u(t,  t  +  í)) 


+  M6, 


(5.5) 


1  —  /3u(t,  t  +  8)  —  M 

donde  M  =  /3co(f38,8),  tiene  al  menos  una  raíz  real  positiva,  y  denotamos  por  R  la  raíz 
positiva  más  pequeña  de  (5.5), 


M  +  (3üj(R,  R  +  ó)  <  1 


(5.6) 


y  B(xq,R)  C  fl,  entonces  el  método  de  Steffensen,  empezando  en  x0,  está  bien  definido 
y  converge  a  una  solución  x*  de  F(x)  =  0.  Además,  la  solución  x*  y  las  iteraciones  xn 
pertenecen  a  B(xo,R)  y  x*  es  única  en  B{xq,R)  D  fL 

DEMOSTRACIÓN.  Comenzamos  probando  que  la  sucesión  {xn}  está  bien  definida,  es  decir, 
xn  G  B(x o,  R)  C  ó,  para  todo  nGN.  Notemos  que 


R  = 


P8 

1  -  P 


+  M8 , 


(5.7) 


donde  P  = 


M 


1  -  Pu(R,  R  +  8) 


<  1. 


A  partir  de  (Ci)-(C2)  se  sigue  que  x\  está  bien  definida  y,  por  (5.7),  tenemos 

||®i  -  x0\\  <  HAó1!!  ||F(x0)||  <  ¡38  <R. 


Luego,  Xi  G  B{xq,R).  Además,  por  el  lema  5.1,  Ffxf)  =  ([^i,  x0;  F]  —  A0)  (aq  —  xf)  y,  en 
consecuencia, 

||-F(®i)||  <  || [xi, x0]  F]  -  A0 ||||xi  -  xQ 1| 

<  o;(||xi  -  x0||,  ll^(^o) IDII^i  -  £o|| 
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De  nuevo,  por  (|5.7|),  se  sigue 

X\ 


A  +  F{x i)  —  MI  <  |A  —  MI  +  A(MII  <  /3S  +  MS  <  R  y 


f  F(x i)  E  B(x0,R). 

A  continuación,  teniendo  en  cuenta 


I  - 


<  HA)  1||  ||M  —  Ai|| 

<  /MIA  -  a?o||,  IA  +  F(x1)  -  x0  -  F(x0)ll) 

<  /MIA  -  MI?  |A  +  F(x i)  -  MI  +  ll-P(xo)ll) 

<  /3u(/3S,  ¡35  +  5) 

<  Pu{R,R  +  §) 


<  1, 


vemos,  por  el  lema  de  Banach  (lema  1.22),  que  existe  el  operador  A1  y  es  tal  que 


HAi  < 


P 


1  -Pu(R,R  +  5)' 


En  consecuencia,  como  P  <  1,  se  sigue 

A  ~  MI  <  ||A71||||F(a;i)||  <  P\\xi  -  MI  <  /35, 

1  -  p2  BS 

IA  -MI  <  A  -  MI  +  IA  -  MI  <  (i  +  p) A  -  MI  =  1  _  p  IA  -  MI  <  1  _  p  <  R- 

Por  lo  tanto,  x2  E  B(x0,R).  También,  como 

AM)II  <  II A, f]  —  Ai\\ \\x2  —  M| 

<  MIA  -  X\ || ,  ||F(x1)||)||x2  -  M| 

<  oj(/3S,  h)|A  -  MI 

<  M5 

<  6, 


se  sigue 

||a;2  +  F(x2)  -  MI  <  IA  -  MI  +  AA)II  <  Y~~J5  +  Mó  =  R 

y  x2  +  f(x2)  e  B(x0,R). 

Ahora  podemos  demostrar  por  inducción  matemática  sobre  n  que  se  cumplen  los  siguientes 
tres  ítems  para  íi6N: 


■  El  operador  An1  existe  y  es  tal  que  ||An1||  < 


P 

1  -Pu(R,R  +  5)' 


■  AAOII  <  u(P8,8)\\xn  -  xn_i 


•  ||xn+1  -xn||  <  P||x„  -x„_i 


<  Pn\\x\  -  x0||  <  p8, 
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siempre  que  +  F(xí);F]  sea  invertible  y  x¿+i,Xj+i  +  P(a++i)  e  B(xo,R),  para 

todo  i  —  1,  2, . . . ,  n  —  1. 

En  primer  lugar,  por  hipótesis,  vemos 


IJ-VA»! 


< 

e 

1 

o 

1  o 

< 

/M \\Xn  -  P)||,  \\Xn 

-  x0  +  F(xn )  -P(xo)||) 

< 

Poj(\\xn  -  ar0||,  \\xn 

+  F(xn)  -  ar0 1|  +  ||P(x0)||) 

< 

Pu(R,R  +  5) 

< 

1 

y 


Pn  II  < 


p 


1  -  /9w(i2,  R  +  5)' 


En  segundo  lugar,  por  el  lema  5.1  F(xn)  =  ([xn,xn_i;  F]  —  An_i)(xn  —  xn_i)  y 

|| F(xn^  ||  fb  ||  [xn,  xn—\:  P]  hln_i  ||  || xn  ícn_i  || 

<  w(||xn  -  xn_i||,  ||F(xn_i)||)||a;n  -  ar„_i|| 


<  u(pS,S)\\xn-  xn-i 

<  M5 

<  S. 


Como  ya  hemos  indicado  anteriormente,  existen  todas  las  diferencias  divididas  de  primer 
orden  utilizadas  porque,  en  otro  caso,  obtendríamos  xn  =  xn_\  o  F(xn)  =  0,  lo  que  indicaría 
que  ya  habríamos  alcanzado  una  solución  de  F(x)  =  0  y  el  resultado  quedaría  probado. 

En  tercer  lugar,  vemos  que 


\\xn 


%n—  1 


<  WKVMW 

<  PwjPS,  j) 

“  1  -Pu(R,R  +  5) 


=  BWXn-Xn-! 

<  Pn  ||xi  —  x0|| 

<  ps. 


En  consecuencia, 


\\xn+1  -  x0|| 


71+1 

<  \\xi  ~  xí-ill 

7  =  0 

<  (Pn  +  Pn_1H - b  P  +  l)||£i  -  £0|| 


< 

< 


l  _  pn+l 

1-P 


Xi  -  x0|| 


ps 

1-P 


<  p, 
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\\xn+i  +  F{xn+i)  ~  ícoll  <  \\xn+i  -  x0||  +  ||F(xn+i)||  < 


ps 

1-P 


+  M5  =  R, 


por  (5.7)  y  ser  P  <  1.  Luego,  xn+i,xn+i  +  F(xn+ 1)  G  B(x0,R),  para  todo  neN. 

Una  vez  probado  que  la  sucesión  {xn}  está  bien  definida,  vemos  que  es  una  sucesión  de 
Cauchy.  En  efecto,  como 


||^'n+j  Xn  ||  ^  1 1  %n+j  %'n+j—  1 1 1  "L  H^n+j  —  1  \  \  ~\~  ’  ’  ’  ~\~  H^n+l 

<  (Pj_1  +  Pi_2H - f  P  +  l)||x„+i  -  xn\\ 

1  -  Pj 

=  ^  Jd  lUre+l  *£n|| 

pn 

<  ll*i -*oll, 


para  j  >  1,  y  P  <  1,  es  claro  que  {xn}  es  una  sucesión  de  Cauchy.  Por  tanto,  la  sucesión 
{xn}  es  convergente.  Ahora,  si  límxn  =  x*,  vemos  que  x*  es  una  solución  de  F(x)  =  0.  Como 


||A(a;n)||  <  u(PS,S)  \\xn  -  zn_i|| 


y  \\xn  —  £n_i||  — >  0,  cuando  n  — y  oo,  se  sigue  fácilmente,  por  la  continuidad  de  F,  que 
F(x*)  =  0. 

Finalmente,  probamos  la  unicidad  de  la  solución  x*  en  B(x o,  R).  Supongamos  entonces  que 
tenemos  otra  solución  y*  G  B(xo,R),  y*  ^  x*,  de  la  ecuación  F(x)  =  0.  Sea  J  =  [y*,x*;F\. 
Si  J  es  inversible,  entonces  x*  =  y*,  puesto  que  J(y*  —  x*)  =  F(y*)  —  F(x*).  Para  ver  que 

),  con  ver  que  ||J  —  Aq1  J||  <  1.  En 

efecto,  si  x0  ^  x0  +  F(x 0),  por  hipótesis  tenemos 


J  es  invertible,  basta,  por  el  lema  de  Banach  (lema  1.22 


I-A~0lJ\\  <  IIAó^HIAo-Jll 

<  ll^o 1 II II [^o,  +  F(xq)  \  F]  -  [y*,x*;F\\\ 

<  Puj(\\y*  -  x0\\,\\x*  -  x0- F(x0)\\) 

<  Pu(\\y*  -  x0||,  ||x*  -  x0||  +  ||A(a;o)||) 

<  Pu(R,R  +  5) 

<  1. 


Luego,  el  operador  J  1  existe.  ■ 


5.1.2.  Accesibilidad 

Una  vez  probada  la  convergencia  semilocal  del  método  de  Steffensen,  nuestro  siguiente 
objetivo  es  ver  cuál  es  el  dominio  de  parámetros  de  este  método. 

Es  conocido  que  el  operador  F  es  diferenciable  si  la  función  cu  que  aparece  en  (C3)  cumple 
o;(0,  0)  =  0,  [37].  En  otro  caso,  el  operador  F  puede  ser  no  diferenciable.  A  continuación, 
vamos  a  analizar  dos  casos  particulares  de  la  función  oj :  uno  diferenciable  y  otro  no  diferen¬ 
ciable. 
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Como  hemos  visto  en  la  discretización  de  ecuaciones  diferenciales  e  integrales,  es  conocido 
que  la  función  cu  que  aparece  en  (C3)  es  frecuentemente  de  la  forma 


ui(s,  t)  =  L  +  K(s  +  t),  L,K>  0. 


(5.8) 


En  este  caso,  la  ecuación  (5.5)  del  teorema  |Y2  se  puede  transformar  en  la  siguiente  ecuación 
cuadrática: 

2K/3t2+(M(l-2K/35)+/3(L+KÓ(1^2f3))-l)t-5(M2+(L/3+K/35-l)(M+/3))  =  0,  (5.9) 


donde  M  =  f3(L  +  K6(  1  +  (3)).  Y  la  condición  (5.6)  se  transforma  en  la  condición 

M  +  P(L  +  K(2R  +  6))  <  1, 


(5.10) 


donde  R  es  la  raíz  positiva  más  pequeña  de  (5.9)  siempre  que  exista. 


Analizamos  a  continuación  la  ecuación  (5.9)  viendo  cuándo  tiene  dos  raíces  reales  positi¬ 


vas.  La  ecuación  anterior  tendrá  dos  raíces  reales  positivas  si 

M{  1  -  2 AY/3)  +  /3(A  +  AY(1  -  2/3))  -  1  <  0, 

<0, 


(5.11) 

S  (M2  +  (A/3  +  AY/3  -  1  )(M  +  /3))  <  0,  (5.12) 

A  =  (M(  1  -  2KS/3)  +  /3(A  +  AY(1  -  2/3))  -  l)2  +  8 K5/3  (M2  +  (A/3  +  KS/3  -  1  ){M  +  /3)) 

=  [m{  1  -  2K5/3)  +  (3(L  +  KS(1  -  2/3))  -  1  +  yJ—8K5/3  (M2  +  ( L/3  +  KS/3  -  1  )(M  +  f3)) 

x  (m(  1  -  2K5/3)  +  /3(A  +  K6(l  -  2/3))  -  1  -  y/-8K6p  (M2  +  (A/3  +  KS/3  -  1)(M  +  (3)) 

>  0. 

Observamos  que  los  dos  factores  de  A  son  <  0  si 

M(  1  -  2K/3S)  +  P(L  +  KS(1  -  2/3))  +  v/-8A'/3á(M2  +  (A/3  +  K/36  -  1  )(M  +  (3))  <  1.  (5.13) 


Además,  se  cumple  (5.11)  si  se  satisface  (5.13).  Por  lo  tanto,  la  ecuación  (5.9)  tendrá  dos 
raíces  reales  positivas  si  se  cumplen  (5.12)  y  (5.13).  Si  la  ecuación  (5.9)  tiene  dos  raíces  reales 


positivas,  entonces  la  raíz  positiva  más  pequeña  es: 

1 


R  = 


AK/3 


(l  -  Aí(l  -  2K/35)  -  P(L  +  K6(l  -  2/}))  -  ^A)  . 


(5.14) 


Notemos  que  también  podemos  considerar  que  la  ecuación  (5.9)  tenga  una  raíz  doble  sin 
más  que  tener  en  cuenta  la  desigualdad  no  estricta  en  (5.13). 


A  continuación,  sustituimos  el  valor  de  R  en  (5.10)  y  vemos  que  (5.10)  se  cumple  si 

1  -  L/3  -  (1  +  2KS/3)M  -  Kó/3(1  +  2/3)  +  VA>0.  (5.15) 


Destacamos  que  no  consideramos  la  posibilidad  de  que  la  ecuación  cuadrática  (5.9)  tenga 
una  raíz  real  positiva  y  otra  negativa  porque,  en  este  caso,  la  raíz  real  positiva  nunca  cumple 
la  condición  (5.15). 

Teniendo  en  cuenta  lo  anterior,  enunciamos  el  siguiente  resultado,  cuya  demostración  se 
sigue  fácilmente  sin  más  que  cumplir  las  hipótesis  del  teorema  5.2  cuando  u>(s,t)  es  la  función 
definida  en  (5.8). 
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Corolario  5.3.  Sean  X  un  espacio  de  Banach  y  F  :  íl  C  I  ->  I  un  operador  no  lineal  defi¬ 
nido  en  un  dominio  abierto  convexo  no  vacío  ó.  Supongamos  que  se  cumplen  las  condiciones 


(Ci)— (C3),  siendo  oj  la  función  que  se  define  en  (5.S).  Además,  si  se  cumplen  (5.12),  (5.13) 


1 5.15 )  y  B(xq,R)  C  ó,  donde  R  está  definido  en  (5.14),  entonces  el  método  de  Steffensen, 
empezando  en  x0,  está  bien  definido  y  converge  a  una  solución  x*  de  F(x)  =  0.  Además,  la 
solución  x*  y  las  iteraciones  xn  pertenecen  a  B{x o,  R )  y  x*  es  única  en  B{x o,  R)  fl  ó. 


Caso  diferenciable 

A  continuación,  analizamos  la  accesibilidad  del  método  de  Steffensen  desde  el  punto  de 
vista  teórico  de  los  dominios  de  parámetros  asociados  al  resultado  anterior  de  convergen¬ 
cia  semilocal.  Para  ello,  distinguimos  dos  casos:  el  caso  diferenciable,  L  =  0,  y  el  caso  no 
diferenciable,  L  /  0. 


En  la  figura  5A  podemos  visualizar  el  dominio  de  parámetros  asociado  al  corolario  5.3 
cuando  F  es  diferenciable  (caso  L  —  0).  Así,  el  dominio  de  parámetros  es  la  región  del  plano 
cuyos  puntos  representan  los  parámetros  correspondientes  a  los  puntos  de  salida  a  partir  de  los 
cuales  está  garantizada  la  convergencia  del  método  de  Steffensen,  indicando  entonces  a  partir 
de  qué  puntos  de  salida  está  garantizada  la  convergencia  del  método  bajo  las  condiciones  (Ci)- 


(C3),  donde  c o  es  la  función  definida  en  (5.8)  con  L  —  0.  Para  representarlo  gráficamente, 
consideramos  el  plano  xy,  con  x  =  ¡3  (eje  de  abscisas)  e  y  =  K5  (eje  de  ordenadas),  y 


coloreamos  los  valores  de  los  parámetros  que  verifican  las  condiciones  (5.12),  (5.13)  y  (|5.15[), 
cuando  L  —  0,  y  que  se  imponen  en  el  corolario  5.3  Observamos  que  las  condiciones  iniciales 
(Ci)  y  (C2),  exigidas  al  punto  de  salida  x0,  definen  los  parámetros  ó  y  (3,  mientras  que  la 
condición  (O3),  exigida  al  operador  F,  define  el  parámetro  fijo  K. 

Por  otra  parte,  consideramos  el  análisis  de  la  convergencia  semilocal  del  método  de  Stef¬ 


fensen  mediante  el  principio  de  la  mayorante  de  Kantorovich,  sección  4.1.1 ,  y  representamos 


gráficamente  el  dominio  de  parámetros  asociado  al  teorema  4.1,  de  manera  que  podamos 


compararlo  con  el  asociado  al  corolario  5.3  cuando  L  —  0  y  ver  cuál  es  mayor.  Para  ello, 
tenemos  que  representar  los  mismos  valores  en  los  ejes  x  e  y  del  plano  en  el  que  vamos  a 
representar  los  dos  dominios  de  parámetros.  En  consecuencia,  tenemos  que  escribir  6  y  C 
en  función  de  (3  y  K,  de  manera  que  así  representamos  los  valores  de  los  inversos  de  las 
diferencias  divididas  en  el  eje  x  y,  en  el  eje  y ,  el  producto  de  ó  por  la  constante  de  Lipschitz 
K  para  la  diferencia  dividida.  Procedemos  entonces  como  se  detalla  a  continuación. 

Por  una  parte,  como 

\\I-A^F'(x0)\\  <  WA^WWAo  -  F\x0)\\  <  /3\\A0  -  [x0,x0;  F]\\  <  K/3\\F(x0)\\  =  K/36, 


se  sigue,  por  el  lema  de  Banach  (lema  1.22),  que  si  K¡38  <  1,  existe  [F;(xo)]  1  y  es  tal  que 

P 


ii[n*o)ru< 


1  -K/3S' 


Así,  6  = 


P 


1  -  Kf3ó 
Por  otra  parte,  como 


\F'(x)-F'(y)\\  =  || [x,x;F\  -  [y,y,F] ||  <  2K\\x  -  y\\, 


se  sigue  que  C  =  2 K. 
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En  consecuencia,  para  que  se  cumplan  las  dos  condiciones  dadas  en  (4.4),  teorema  4.1 
tienen  que  cumplir  las  siguientes  tres  condiciones 


se 


K/3Ó  <  1, 

que  se  reducen  a 

2 KQ5  <  1 


2K/3Ó 

- - -  <  2 

1  -  K/35  ~ 


y  2  K/35 


(1-¡3(2K6-1)\ 
{  (l-IiflSy  ) 


y  4(K/35)2  -  AK/36(2  +  0(1  -  2 KS))  +  1  >  0. 


Y,  por  tanto,  ya  estamos  en  condiciones  de  poder  comparar  los  dominios  de  parámetros 


asociados  al  corolario  5.3  cuando  L  =  0  y  al  teorema  4.1 


En  la  figura  [57T|  vemos  claramente  que  el  dominio  de  parámetros  asociado  al  corolario  5.3 


cuando  L  =  0  es  mayor  que  el  asociado  al  teorema  4.1  Notamos  que  las  regiones  están 


superpuestas.  Por  lo  tanto,  utilizando  la  técnica  de  demostración  de  la  convergencia  semilocal 
desarrollada  en  este  capítulo,  mejoramos  el  dominio  de  parámetros  que  se  obtiene  mediante 
la  técnica  clásica  del  principio  de  la  mayorante  de  Kantorovich  desarrollada  en  el  capítulo 
anterior. 


0.0  0.2  0.4  0.6  0.8  1.0 


Figura  5.1:  Dominios  de  parámetros  del  método  de  Steffensen  asociados  al  corolario  |5.3 
cuando  L  —  0  (anaranjado)  y  al  teorema  4.1  (gris). 


Caso  no  diferenciable 


Si  ahora  consideramos  el  corolario  5.3  con  L  ^  0,  al  fijarnos  en  las  condiciones  (5.12), 


(5.13),  (5.15),  vemos  que  el  valor  de  L  está  libre.  Al  visualizar  entonces  en  la  figura  5.2  el 
dominio  de  parámetros  asociado  a  dicho  corolario,  con  L  ^  0,  podemos  decir  que  el  dominio 
de  parámetros  es  mayor  cuanto  menor  es  el  valor  de  L,  obteniéndose  como  situación  óptima 
el  caso  diferenciable  (L  —  0).  Notamos  que  las  regiones  están  superpuestas. 
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Figura  5.2:  Dominios  de  parámetros  del  método  de  Steffensen  asociados  al  corolario  5.3 


cuando  L  —  ^  3,  «p  yó  (verde,  rojo,  amarillo  y  azul,  respectivamente). 

5.1.3.  Aplicación 

A  continuación  ilustramos  el  estudio  realizado  anteriormente  con  dos  sistemas  de  ecuacio¬ 
nes  no  lineales,  uno  diferenciable  y  otro  no  diferenciable,  que  surgen  de  la  discretización  de 


ecuaciones  integrales  de  Hammerstein  de  la  forma  (1.41 ),  presentadas  en  la  sección  1.6.1  Para 


el  sistema  diferenciable,  veremos  que  podemos  garantizar  la  convergencia  semilocal  del  méto¬ 
do  de  Steffensen  mediante  el  teorema  5.2|  de  este  capítulo,  pero  no  mediante  el  terorema  4A 
del  capítulo  anterior.  Para  el  sistema  no  diferenciable,  veremos  que  podemos  garantizar  la 


convergencia  semilocal  del  método  de  Steffensen  mediante  el  teorema  5.2 


Así,  consideramos  (1.41)  con 


H(t,  x(t))  =  Sx(t)2  +  fi\x(t)\,  í,/i6l, 

y  la  trasformamos,  mediante  un  proceso  de  discretización,  tal  y  como  se  hace  en  la  sec¬ 


ción 


1.6. 1[  en  el  siguiente  sistema  de  ecuaciones  no  lineales: 
.F(x)  =  x  —  f  — A(<5x  +  /íx)  =  0, 


F  : 


(5.16) 


donde  x  =  . . . ,  x¡)T,  x  =  (|xi|,  \x2\, . . . ,  |x8|)r  y  Además, 

[u,  v;  F]  =  I  -  A  (Miagjz)  +  /idiagjw}), 

donde  z  =  (zi,  z2,  ■ . . ,  z8)T  con  Z{  =  ut  +  u¿,  para  todo  i  =  1,  2, . . . ,  8,  y  w  =  (wi,w 2, . . . ,  Ws)T 
con  Wi  =  ,  para  todo  i  =  1,  2, . . . ,  8,  de  manera  que  L  =  2|/i|||A||  y  K  =  |<5|||A||. 

Sistema  de  ecuaciones  no  lineales  diferenciable 


Si  f  =  2  =  (2, 2, . . . ,  2)  ,  6  —  |  y  ¡jl  —  0,  entonces  el  sistema  (5.16)  se  reduce  a 


F(x)  =  x  —  2  -  -Ax  =  0,  F  : 


(5.17) 


5.1.  MÉTODO  CORRECTOR:  EL  MÉTODO  DE  STEFFENSEN 
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En  este  caso,  [u,  v;  F]  =  I  —  | A  diagjz}  y  el  sistema  de  ecuaciones  no  lineales  es  diferenciable 
(A*  =  °)- 

Eligiendo  xo  =  Q,  . . . ,  ^  como  punto  de  salida  y  la  norma  del  máximo,  obtenemos 
ó  =  0.7816  . . .,  6  =  1.3335  . . .  y  C  =  0.1853  . . .  Ahora,  vemos  que  la  segunda  condición  de  (4.4) 


del  teorema 


4.1 


1 


no  se  cumple  porque  £ób2  =  0.5295. . .  >  -.  En  consecuencia,  no  podemos 
garantizar  la  convergencia  del  método  de  Steffensen  mediante  la  teoría  de  Kantorovich  con 
el  terorema  E3  del  capítulo  anterior. 


Sin  embargo,  sí  que  la  podemos  garantizar  mediante  el  teorema  5.2  de  este  capítulo,  puesto 


que  la  ecuación  (5.5),  que  se  reduce  a 


(0.2272  . .  .)(t  -  2.5669  . .  .)(t  -  1.6860  . . .) 
(0.2272... )t-  (0.7135...) 


=  0, 


tiene  dos  raíces  reales  positivas  y  la  más  pequeña,  R  =  1.6860  . . .,  cumple  la  condicióon  (5.6), 
ya  que 

M  +  Pu(R,  R  +  5)  =  0.6695  . . .  <  1, 

donde  M  =  0.1976  ...  y  a ;(s,  t )  =  K(s  +  t )  con  K  =  0.0926  . . . 

En  la  situación  anterior,  utilizando  el  método  de  Steffensen,  después  de  cinco  iteraciones 
y  usando  el  criterio  de  parada  ||xn  —  xn_i||  <  10-16,  obtenemos  la  aproximación  numérica 
x*  =  (x\,  xí,,  ■  ■  ■ ,  xl)T  de  una  solución  de  (5.17)  que  se  puede  ver  en  la  tabla  5.1 
tabla  5.2  mostramos  los  errores  ||x„  —  x* 


En  la 


obtenidos  usando  el  mismo  criterio  de  parada. 


Notemos  que  el  vector  dado  en  la  tabla  5.1  es  una  buena  aproximación  de  la  solución  del 
sistema  (5.17),  puesto  que  ||F(x*)||  <  constante  x  1CT16.  Mostramos  la  sucesión  {||F(xn)||} 
en  la  tabla  15.21 


Además,  por  el  teorema  5.2,  la  existencia  y  unicidad  de  la  solución  está  garantizada  en  la 


bola  £>(x0, 1.6860  . . .). 


i 

x* 

i 

x* 

i 

X* 

i 

X* 

1 

2.042845 . . . 

3 

2.422455 . . . 

5 

2.576941 . . . 

7 

2.206427. . . 

2 

2.206427... 

4 

2.576941 . . . 

6 

2.422455 . . . 

8 

2.042845 . . . 

Tabla  5.1:  Aproximación  de  la  solución  x*  de  (5.17) 


n 

llXn 

-x*|| 

||F(x 

n)  II 

0 

1.1769... 

7.8163... 

x  lO”1 

1 

2.2469 . 

. .  x  10"1 

1.3937... 

x  10”1 

2 

8.8921. 

. .  x  10~3 

5.4331 . . . 

x  10“3 

3 

1.4371 . 

. .  x  10~5 

8.7842 . . . 

x  10”6 

4 

3.7504. 

.  x  10-11 

2.29284. . . 

x  10"11 

Tabla  5.2:  Errores  absolutos  y  ||F(xn)||  para  (5.17) 
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Sistema  de  ecuaciones  no  lineales  no  diferenciable 


Si  f  =  2  =  (2, 2, . . . ,  2)t  y  5  =  ¡i  =  |,  entonces  el  sistema  (5.16)  se  reduce  a 


F(x)  =  x-2--A(x  +  x)  =  0,  F  : 


(5.18) 


En  este  caso,  [u,  v;F]  =  I  —  |A(diag{z}  +  cliagjw})  y  el  sistema  de  ecuaciones  no  lineales 
es  no  diferenciable  (/í  ^  0). 

Si  elegimos  x0  =  (j?,  ^P, . . . ,  pp)  como  punto  de  salida  y  la  norma  del  máximo,  obtenemos 


ó  =  0.3594 (3  =  1.5115 ...  y  la  ecuación  (5.5),  que  se  reduce  a 

(0.1867 . .  .)(t  -  2.2255  . .  ,)(í  -  1.1385  . . .) 


(0.1867... )t-  (0.5085...) 


=  0, 


tiene  dos  raíces  reales  positivas  y  la  más  pequeña,  R  =  1.1385 . . .,  cumple  la  condición  (5.6), 
ya  que 

M  +  0u(R,  R  +  S)  =  0.7040  . . .  <  1, 

donde  M  =  0.2710  ...  y  cu(s,  t)  —  L  +  K(s  +  t)  con  L  =  0.1235  ...  y  A'  =  0.0617 . . . 

A  continuación,  utilizando  el  método  de  Steffensen,  después  de  cuatro  iteraciones  y 
usando  el  criterio  de  parada  ||xn  —  xn_ ! 1 1  <  10~16,  obtenemos  la  aproximación  numérica 
x*  =  (#*,  Xj,  •  •  • ,  xl)T  de  una  solución  de  (5.18)  que  se  puede  ver  en  la  tabla  5.3  En  la 
tabla  5.4  mostramos  los  errores  ||xn  —  x*||  obtenidos  usando  el  mismo  criterio  de  parada. 
Notemos  que  el  vector  dado  en  la  tabla  523  es  una  buena  aproximación  de  la  solución  del 
sistema  (5.18),  puesto  que  ||A(x*)||  <  constante  x  1CT16.  Mostramos  la  sucesión  {||A(xn)||} 
en  la  tabla  15.41 

Además,  por  el  teorema  522  la  existencia  y  unicidad  de  la  solución  está  garantizada  en  la 
bola  -B(x0, 1.1385  . . .). 


i 

x* 

i 

x* 

i 

x* 

i 

x¡ 

1 

2.039360 . . . 

3 

2.383586 . . . 

5 

2.521279. . . 

7 

2.188708... 

2 

2.188708... 

4 

2.521279... 

6 

2.383586 . . . 

8 

2.039360 . . . 

Tabla  5.3:  Aproximación  de  la  solución  x*  de  (5.18) 


n 

||xn 

-  x1l 

||A(X 

n)  || 

0 

3.6063. 

..  x  10"1 

3.5949 . . . 

x  lO”1 

1 

2.3907. 

. .  x  10"3 

1.6324. . . 

x  10“3 

2 

6.7249. 

..  x  10“7 

4.6622 . . . 

x  10“7 

3 

5.0981. 

.  x  10~14 

3.5423... 

x  10~14 

Tabla  5.4:  Errores  absolutos  y  ||A(xn)||  para  (5.18) 
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5.2.  Método  predictor:  el  método  simplificado  de  Stef- 
fensen 


A  la  hora  de  mejorar  la  accesibilidad  del  método  de  Steffensen,  proponemos,  en  este 
capítulo,  un  método  iterativo  híbrido  (predictor-corrector)  que  no  utiliza  derivadas  en  su 
algoritmo.  Teniendo  en  cuenta  que  el  resultado  de  convergencia  semilocal  que  acabamos  de 
establecer  para  el  método  de  Steffensen,  teorema  5.2,  es  aplicable  a  operadores  no  diferen¬ 
ciadles,  consideramos,  como  método  predictor  para  el  método  híbrido,  un  método  iterativo 
que  no  utilice  derivadas.  En  concreto,  utilizaremos  el  método  simplificado  de  Steffensen  (5.4), 
que,  como  veremos,  tiene  mayor  dominio  de  parámetros  que  el  método  de  Steffensen. 


5.2.1.  Convergencia  semilocal 

Comenzamos  estudiando  la  convergencia  semilocal  del  método  simplificado  de  Steffensen 
(5.4)  bajo  las  mismas  hipótesis  generales  que  para  el  método  de  Steffensen,  aunque,  en  este 
caso,  como  el  objetivo  de  la  sección  es  comparar  los  dominios  de  parámetros  de  los  métodos 
simplificado  de  Steffensen  (5.4)  y  de  Steffensen,  tanto  en  situaciones  diferenciables  como  no 
diferenciables,  exigimos  directamente  la  condición  (H3)  en  vez  de  (C3).  Así,  suponemos  que 
se  cumplen: 

m  I|EOo)||  <  So, 

(H2)  existe  [zq,Zq  +  F(z<¡)\ F]-1  =  Bq1  G  C(X,X),  para  z0  G  Í2,  y  es  tal  que 
Il^o"1||<^o, 

(H3)  \\[x,y,F]-[u,v,F]\\  <  L  +  K(\\x-u\\  +  \\y-v\\)-L,K  >  0;  x,  y,  u,  v  G  Q;  x 
y\u±v. 

Ahora,  damos  el  siguiente  lema  técnico  que  utilizamos  después. 


Lema  5.4.  Sea  {zn}  la  sucesión  dada  por  el  método  simplificado  de  Steffensen  (5.f).  Si 
zm_i  zm  con  zm_ i,  zm  G  í),  entonces 

F(zm)  zm— i,  d  7?o)  (*m  zm—  i). 

Demostración.  A  partir  de  la  definición  de  {zn},  se  sigue 

F(zm-i)  T  B0(zm  zm—  i)  0, 

de  manera  que 

F^Zm)  =  Fi^Znfj  FíyZm—  i)  BfiZm  Zm— l) 

\Zrnj  Zm—  I;  Ffizm  Zm—  i)  Bfizm  Zm—  i  ) 

([^m;  Zm—  1)  E]  Bq)  ( Zm  Zm—  i).  I 

A  continuación  presentamos  un  resultado  de  convergencia  semilocal  para  el  método  sim¬ 
plificado  de  Steffensen  (5.4). 
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Teorema  5.5.  Sean  X  un  espacio  de  Banach  y  F  :  O  C  X  — y  X  un  operador  no  lineal  defi¬ 
nido  en  un  dominio  abierto  convexo  no  vacío  ó.  Suponemos  que  se  cumplen  las  condiciones 
Si  la  ecuación 


í  1  +  N  —  fio (L  +  A  (2 1  +  5o))  \  „  r 
l  1  —  A)(A  +  K{2t  +  <50))  )l0° 


(5.19) 


donde  N  =  fio (L  +  AA0(1  +  /30 ) ) ,  tiene  al  menos  una  raíz  real  positiva,  y  denotamos  por  r  la 
raíz  positiva  más  pequeña  de  (5.19 |), 


Q  —  fio(L  +  K (2 r  +  ¿o))  <  1 


(5.20) 


y  B(zo,r)  C  ó,  entonces  el  método  simplificado  de  Steffensen  (5-4),  empezando  en  zq,  es¬ 
tá  bien  definido  y  converge  a  una  solución  z*  de  F(x)  =  0.  Además,  la  solución  z*  y  las 
iteraciones  zn  pertenecen  a  B(x0,r )  y  z*  es  única  en  B(x0,  r )  n  ó. 

Demostración.  Comenzamos  probando  que  la  sucesión  {zn}  está  bien  definida,  es  decir, 
zn  G  B(z0,r )  C  ó,  para  todo  n  G  N.  Notemos  que  la  raíz  real  positiva  más  pequeña  r  de  la 
ecuación  (5.19)  es: 


r=(1  +  í^ó)w>- 


(5.21) 


A  partir  de  ( )  y  como  consecuencia  de  (|5.21[),  se  sigue  que  Zi  está  bien  definida  y 

||¿i  -  ¿o||  <  IIAo^IIIIA^o)!!  <  fioóo  <  r. 


Luego,  zi  G  B(z0,r). 

A  continuación,  podemos  definir  z2  =  ¿i  —  Bq1F(z\)  y 


¿2  ¿i  1 1  <  ||Ao1||||A(^1)|| 

<  ll^o 1 II II [¿1, ¿o;  F]  -  Aollll^i  ~z0\\ 

<  fio  (L  +  K(\\zi  -  z0\\  +  ||A(^o)||))  ||¿i  -  zq\\ 

<  fio{L  +  Aá0(l  +  A)))||¿i  —  ¿olí 

=  Ar||^i  —  £0||. 


Además,  por  (5.21),  también  se  tiene  que 


¿2  —  ¿0 1|  <  ||  ¿2  —  ¿l||  +  ||¿1  —  ¿o||  <  (1  +  3V)||^!  —  II  <  (1  +  3V)/30áo  <  r 


y,  por  tanto,  z2  G  B(zo,r). 

Suponemos  ahora,  para  i  —  1,  2, . . . ,  n,  que 

<  N  Ql~2\\zi  -  z0\\, 


¿¿  -  ¿olí  < 


(l  +  N 


i*  Q1-1) 

i -Q  J 


||¿i  -  ¿olí  <  r, 


donde  Q  <  1  por  (5.20). 
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Entonces,  zn+1  =  zn  —  B0  lF(zn )  está  bien  definido  y 

||zn+i-*n||  <  ll^o 1 1111^(^)11 

—  1 1  B0  lili  \Z"n ,  -<-n— 1 ;  Bq  lili  Zn  Z. n—  1 1 

<  Po{L  +  K  (||  Zn  —  Zq\\  +  ||^n-l  —  -o||  +  ll-^(-o)ll))  ||-n  —  -n-l|| 

<  Po(L-\-K(2r  +  áo))  ll^n  — -n-1  II 
Q||-n  %n— 1 1 1 

<  NQn-l\\Zl  -zo\\. 

Notemos  que  las  diferencias  divididas  de  primer  orden  [zn,  zn-\  \  F]  existen  ya  que  si  zn  =  zn- 1, 
zn_ i  es  una  solución  de  F(x)  =  0,  la  sucesión  {zn}  sería  convergente  y  el  resultado  quedaría 
probado. 


Además,  por  (5.20),  también  tenemos 


1 1 -ra+ 1  -o||  <  ||-n+l  -  -n||  +  ||-n  -  -o|| 

<  (N(Qn  1  +  •  •  •  +  Q  +  1)  +  1)  ||zi  —  zq\ 
l  -Qr 


=  \^l  +  N 

<  (1  + 

<  (l  + 


1  -Q 

N  \  „ 


\z i  -  z0\ 


1  -Q, 

N  ' 


l -Q, 


||-2l  -  -0| 

AA 


=  r. 


Luego,  zn+ 1  G  B(zo,r),  para  todo  n  G  N. 

Veamos  ahora  que  la  sucesión  { zn }  es  de  Cauchy.  Como 


|  —  n+j  —  n  ||  A  ||  —  n+j  Zn+j— 1||  ~b  ||—  n+j—  1  Zn+j— 2 1 1  F  '  '  '  T  ||— n+1  — n 

<  (QJ  1  +  2  +  •  •  •  +  Q  +  1)  ll-2-n+l  —  —  n  || 

l-Qj 


< 


1  -Q 
1  -Qj 


1  -Q 

'm—  1 


||-2n+l  ^n|| 

NQn-l\\Zl-z0\ 


<  N 


Qr 


1  -Q 


-i  -  -o  |, 


para  j  >  1  y  Q  <  1,  se  sigue  que  {zn}  es  una  sucesión  de  Cauchy.  Por  tanto,  {zn}  es 
convergente.  Ahora,  si  lím  zn  =  z*  G  B(zo,r),  vemos  que  z*  es  una  solución  de  F(x)  =  0. 
Como 


\\F(zn)\\<(L  +  K(2r  +  S0))\\zn-zn_1 


y  ||zn  —  zn- 1||  -A  0,  cuando  n  — >  oo,  se  sigue  fácilmente,  por  la  continuidad  del  operador  F, 
que  F(z*)  =  0. 
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Terminamos  probando  la  unicidad  de  la  solución  z*  en  B(zo,r).  Suponemos  entonces  que 
existe  otra  solución  y*  e  B(zo,r),  con  y*  ^  z*,  de  la  ecuación  F(x)  =  0.  Sea  J  =  [ y*,z *;  F], 
Si  J  es  inversible,  tenemos  z*  =  y*,  puesto  que  J(y*  —  z*)  =  F(y*)  —  F(z*).  Para  ver  que 
J  es  inversible,  basta,  por  el  lema  de  Banach  (lema  1.22),  con  ver  que  \\I  —  B$lJ\\  <  1.  En 
efecto,  por  hipótesis, 


Bñ1 


J II  < 


B0  ~  J ||  <  ||i?o“1||  II  [-o,  -o  +  ^o);  F]  -  [y\  z *;  F]  || 

<  A> (L  +  K(\\y*  -  zo\\  +  \\z*  -z0-  F(2o)||)) 

<  Po{L  +  K  (||  y*  —  zq\\  +  \\z*  —  ,z0||  +  ||^(^o)||)) 

<  /3o {L  +  K  (2 r  +  ¿o)) 

<  1. 


Luego,  el  operador  J  1  existe 


5.2.2.  Accesibilidad 


Una  vez  probada  la  convergencia  semilocal  del  método  simplificado  de  Steffensen  (5.4), 
nuestro  siguiente  objetivo  es  ver  cuál  es  el  dominio  de  parámetros  de  este  método  para 
compararlo  con  el  de  Steffensen.  Para  ello,  transformamos  la  ecuación  (5.19)  en  la  siguiente 
ecuación  cuadrática: 


2K (30t2  +  (p0(L  +  K50(l  -  2 &))  -  1)  í  +  50(30(1  +  K50fá)  =  0.  (5.22) 

Como  el  término  independiente  de  la  ecuación  anterior  es  siempre  positivo,  para  que  dicha 
ecuación  tenga  al  menos  una  raíz  real  positiva,  las  dos  raíces  tienen  que  ser  positivas.  Vemos 
entonces  cuándo  tiene  dos  raíces  reales  positivas,  lo  que  ocurre  si 

Po{L  +  K8q(1  —  2/30))  —  1  <  0  (5.23) 


y 

A  =  (A)(L  +  K80(l  -  2A)))  -  l)2  -  8/«o/^(l  +  KSoffi) 

=  (/30(L  +  AA0(1  -  2/30))  -  1  +  ^8AA0/302(  1  +  AA0/302)) 

x  (/30 (L  +  K60(l  -  2/30) )  -  1  -  y/8K60l3$(l  +  K50/3$j)  >  0. 
Observamos  que  los  dos  factores  de  Á  son  <  0  si 


j8o(£  +  A'í„(l  -  2fl,))  +  \/8Aío/302(l  +  KS „/302)  <  1. 


(5.24) 


Luego,  A  >  0  si  se  cumple  (5.24).  También,  como  consecuencia  de  (5.24),  se  cumple  (5.23). 
En  este  caso,  la  raíz  positiva  más  pequeña  de  (5.22)  es 

1 


r  = 


4iL/30 


1  -  A)(L  +  K60(l  -  2/30))  -  y  A 


(5.25) 


A  continuación,  vemos  cuándo  se  cumple  la  condición  (5.20)  del  teorema  5.5  Para  ello, 
sustituimos  el  valor  de  r  en  (5.20)  y  obtenemos 


1  —  Po{L  +  K áo(l  +  2/30)  +  y  A  >  0. 


(5.26) 
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Notemos  que  también  podemos  considerar  que  la  ecuación  (5.22)  tenga  una  raíz  real 


positiva  doble  sin  más  que  tener  en  cuenta  la  desigualdad  no  estricta  en  (5.24) 


En  consecuencia,  las  condiciones  de  convergencia  que  se  imponen  a  los  parámetros  Sq, 
fio,  L  y  K ,  como  son  que  la  ecuación  (5.19)  tenga  al  menos  una  raíz  real  positiva  y  que  la 


raíz  real  positiva  más  pequeña  de  (5.19),  denotada  por  r,  cumpla  (5.20),  se  van  a  cumplir 


siempre  que  se  cumplan  (5.24)  y  (5.26).  Así,  enunciamos  entonces  el  siguiente  resultado,  cuya 


demostración  se  sigue  fácilmente  sin  más  que  satisfacer  las  hipótesis  del  teorema  5.5 


Corolario  5.6.  Sean  X  un  espacio  de  Banach  y  F  :  Í2  C  X  — >■  X  un  operador  no  lineal 
definido  en  un  dominio  abierto  convexo  no  vacío  Í2.  Supongamos  que  se  cumplen  las  condicio¬ 
nes  (Hi)-(H3).  Además,  si  se  cumplen  (5.24),  (5.26)  y  B(z0,r )  C  Í2,  donde  r  está  definido 


en  (5.25),  entonces  el  método  simplificado  de  Steffensen  (5-4),  empezando  en  z0,  está  bien 
definido  y  converge  a  una  solución  z*  de  F(x)  =  0.  Además,  la  solución  z*  y  las  iteraciones 
zn  pertenecen  a  B(zo,r )  y  z*  es  única  en  B(zo,r)  D  Í2. 

A  continuación,  representamos  gráficamente  el  dominio  de  parámetros  asociado  al  coro¬ 


lario  5.6  Para  ello,  seguimos  el  mismo  criterio  que  para  el  corolario  5.3  y  distinguimos  dos 
casos:  el  caso  diferenciable  (L  =  0)  y  el  uo  diferenciable  [L  0).  Notemos  que  las  condiciones 
iniciales  (Hi)  y  (H2),  exigidas  al  punto  de  salida  z0,  definen  los  parámetros  á0  y  fio,  mientras 
que  la  condición  (H3),  exigida  al  operador  F .  define  los  parámetros  fijos  L  y  K.  Igual  que 
antes,  consideramos  x  =  fio  (eje  de  abscisas),  y  =  K50  (eje  de  ordenadas)  y  coloreamos  en 
el  plano  xy  los  valores  de  los  parámetros  que  verifican  las  condiciones  (|5.24)  y  (5.26)  del 
corolario  |5.6[  Observamos  entonces  que  los  ejes  de  los  dominios  de  parámetros  asociados  a 


los  corolarios  5.3  y  5.6  representan  los  mismos  valores.  A  la  vista  de  las  figuras  5.3  y  5.4,  po¬ 
demos  decir  que  el  dominio  de  parámetros  es  mayor  cuanto  menor  es  el  valor  de  L.  Notamos 
que  las  regiones  están  superpuestas. 

Si  ahora  comparamos  los  dominios  de  parámetros  de  los  métodos  de  Steffensen  y  simplifi¬ 


cado  de  Steffensen  (5.4),  figuras  5.5  y  5.6 ,  vemos  en  ambos  casos  que  el  dominio  de  parámetros 


del  método  simplificado  de  Steffensen  (5.4)  es  mayor  que  el  del  método  de  Steffensen.  Notamos 
que  las  regiones  están  superpuestas. 


5.3.  Método  iterativo  híbrido  (predictor-corrector) 

A  la  vista  de  todas  las  figuras  anteriores  acerca  de  los  dominios  de  parámetros  de  los 


métodos  de  Steffensen  y  simplificado  de  Steffensen  (5.4),  observamos  que  tenemos  más  po¬ 


sibilidades  de  localizar  puntos  de  salida  para  obtener  convergencia  semilocal  del  método 


simplificado  de  Steffense  ( 5.4  )n  que  para  el  método  de  Steffensen.  Por  tanto,  las  condiciones 


que  garantizan  la  convergencia  semilocal  del  método  de  Steffensen  son  más  restrictivas  que 


las  que  garantizan  la  del  método  simplificado  de  Steffensen  (5.4).  Así,  construimos  un  método 


iterativo  híbrido  (predictor-corrector),  donde  el  método  predictor  es  el  método  simplificado  de 


Steffensen  (5.4)  y  el  método  corrector  es  el  método  de  Steffensen,  que  mejora  la  aplicabilidad 


del  método  de  Steffensen. 


5.3.1.  Construcción  del  método 

Nuestro  objetivo  inmediato  consiste  en  asegurar  que  para  un  par  (óo,fio)  que  satisfaga 


las  condiciones  del  corolario  5.6,  es  decir,  que  (á0 ,  fio)  esté  dentro  del  dominio  de  parámetros 
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0.0  0.2  0.4  0.6  0.8  1.0 


Figura  5.3:  Dominio  de  parámetros  del  mé¬ 
todo  simplificado  de  Steffensen  asociado  al 
corolario  15.61  cuando  L  —  0. 


Figura  5.4:  Dominios  de  parámetros  del  mé¬ 
todo  simplificado  de  Steffensen  asociados  al 
corolario  5.6  cuando  L  =  |,  |,  A  (rosa, 


morado,  magenta  y  cyan,  respectivamente). 


del  método  simplificado  de  Steffensen  (5.4),  obtengamos  un  par  (6n0,Pn0)  que  satisfaga  las 
condiciones  del  corolario  5.3,  después  de  realizar  un  cierto  número  Nq  de  iteraciones  con 


el  método  simplificado  de  Steffensen  (5.4),  y  asegurar  así  la  convergencia  del  método  de 


Steffensen  al  empezar  este  método  en  la  iteración  N0  obtenida  previamente  mediante  el 


método  simplificado  de  Steffensen  (5.4).  Cuando  esto  ocurra,  podemos  considerar  el  par 


(5 n0,  /3n0)  como  par  inicial  (5,/3)  para  el  método  de  Steffensen. 

Para  ello,  construimos  una  sencilla  modificación  del  método  de  Steffensen  que  sea  con¬ 
vergente  cuando  se  tomen  como  puntos  de  salida  los  mismos  que,  a  partir  de  los  cuales, 


garantizan  la  convergencia  del  método  simplificado  de  Steffensen  (5.4).  Así,  consideramos  el 
siguiente  método  iterativo  híbrido  (predictor-corrector) : 


í  dado  Z(,  en  ó, 

\  zj+ 1  =  Zj  -  [zo,  Zq  +  F(z0)- F]~1F(zj),  j  =  0, 1, . . . ,  N0  -  1, 
(  x0  =  zN o  G  ó, 

\  xn+i  =xn-  [xn,  xn  +  F(xn);  F)~lF(xn ),  n  >  0, 
donde  ¿o  satisface  las  condiciones  del  corolario  |5.6|y  x$  las  del  corolario  |5.3 


(5.27) 


Para  que  (5.27)  sea  convergente,  nos  planteamos  entonces  dos  cuestiones: 


1.  Localizar  un  punto  de  salida  Zq,  a  partir  del  cual  el  método  predictor,  el  método  sim¬ 


plificado  de  Steffensen  (5.4),  converja 


2.  A  partir  de  la  convergencia  del  método  predictor,  garantizar  la  existencia  de  un  valor 
No  G  N  tal  que  zn0  se  pueda  tomar  como  punto  de  salida  para  el  método  corrector,  el 
método  de  Steffensen,  y  asegurar  así  después  la  convergencia  de  este  método  al  empezar 
en  x0  =  zNo. 
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Figura  5.5:  Dominios  de  parámetros  de 
los  métodos  de  Steffensen  (anaranjado)  y 
simplificado  de  Steffensen  (marrón)  cuando 
L  —  0  (caso  diferenciadle). 


Figura  5.6:  Dominios  de  parámetros  de  los 
métodos  de  Steffensen  (verde)  y  simplifica¬ 
do  de  Steffensen  (rosa)  cuando  L  —  \  (caso 
no  diferenciadle). 


Entonces,  utilizamos  el  método  simplificado  de  Steffensen  (5.4)  durante  un  número  finito 


de  pasos  N0  hasta  que  Zn0  —  xo  cumpla  las  condiciones  exigidas  para  que  el  método  de 
Steffensen  sea  convergente  y,  después,  aplicamos  el  método  de  Steffensen  en  vez  del  méto¬ 


do  simplificado  de  Steffensen  (5.4).  La  clave  del  prodlema  reside  entonces  en  garantizar  la 
existencia  de  N0. 


5.3.2.  Convergencia  semilocal  del  método 


A  continuación,  estudiamos  la  convergencia  semilocal  del  método  hídrido  (5.27).  A  partir 


del  método  predictor,  el  método  simplificado  de  Steffensen  (5.4),  consideramos  la  siguiente 


situación.  Dada  la  aproximación  inicial  z0,  consideramos  la  sucesión  {zn}  definida  por  el 


método  simplificado  de  Steffensen  (5.4)  junto  con 


P^o)!!  <¿o,  ||[^o,  z0  +  F(z0);  F]  1 1  <  /30 - 


Para  que  el  método  simplificado  de  Steffensen  (5.4)  sea  convergente,  se  tienen  que  cumplir  las 
condiciones  del  corolario  5.6  Después,  iterando,  se  van  definiendo  los  pares  ( ón ,  fin)  asociados 
a  cada  zn. 

En  primer  lugar,  odservamos  que  la  definición  del  par  inicial  (<50,  fio)  para  el  método  de 
Steffensen  es  inmediata  porque  los  parámetros  Úq  y  fio  representan  lo  mismo  en  los  métodos 


de  Steffensen  y  simplificado  de  Steffensen  (5.4).  A  continuación,  procedemos  de  la  siguiente 
forma. 


Primer  paso  del  método  predictor:  definición  del  par  (A1;  /?i) . 
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Notemos 

||-F(si)||  <  \\[zi,  z0]  F]  -  B0\\\\zi  -  z0\\ 

<  (L  +  K(\\zi  -  Zq\\  +  ||F(z0)||))  \W  ~  zo 

<  (L  +  K (Pq8o  +  8o))  P080 

<  (L  +  K{2r  +  80))¡3080 

—  Q8o 

=  8U 


I-Bó1A1 1|  <  ||50-1||||JB0-A1|| 

<  Po  {L  +  K (||zi  —  zq\\  +  \\z\  —  ||  +  ||-f1(^i)||  +  ||i^o)||)) 

<  Pq  (L  +  I((2r  +  íi  +  <5q)) 


—  p0  (L  +  K (2 r  +  (1  +  Q)5o)) 


=  T, 


IPr'll  =  H[zi,Zi  +  -F(zi);iT1||  <  YZPf  =A’ 


siempre  que  T  <  1,  que  puede  escribirse  como 


T  =  (1  +  K80Po)Q  <  I- 


Además,  <5i  =  Q50  <  á05  puesto  que  Q  <  1  si  se  cumple  (5.28). 


(5.28) 


Segundo  paso  del  método  predictor:  definición  del  par  (<52,  /?2) - 
Notemos 

1 1  ^  ÍZ2  )  1 1  <  ||[^2,2i;F]  —  zBoll  11^2  -2l|| 

<  (L  +  K(\\z2  -  ||  +  \\zi  —  Zo  —  F(^o)ll))  \\z2  -  Zi\\ 

<  (L  +  K(\\z2-zo\\  +  \\Z!  -zoW  +  ||F(^o)||))  ||5o~1||||F(^i)|| 

<  {L  +  K  (2  r  +  <5o))  Pq8\ 

=  Q8i 

=  <52, 

\\I-BolA2\\  <  ||jB0-1||||jB0-A2|| 

<  Po  (L  +  K  (||  Z2  —  Z0||  +  \¡Z2  —  ^0 1|  +  ||-f1(^2)||  +  ||^o)ID) 

<  Po  (L  +  K (2 1| z2  —  ||  +  82  +  <5o)) 

—  Po  (L  +  K (2 r  +  (1  +  Q2)ó o)) 

<  Po  (L  +  Á  (2r  +  (1  +  Q)8o)) 

=  T, 

\\A2  1 1|  =  1 1  \z2 ,  z2  +  F(z2);F\  1||  <  =  ^2’ 


siempre  que  T  <  1.  Además,  82  =  Q2ó 0  <  <50,  puesto  que  Q  <  1  si  se  cumple  (5.28). 
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n-ésimo  paso  del  método  predictor:  definición  del  par  (Sn,/3n). 

Notemos 

||  A(¿/n)  ||  A  ||  \_Zni  Zn—1 1  F ]  Bq  ||  ||  Ajn  Zn—  1 1| 

A  ( A  S-  A  ( || Zn—i  Zq  ||  ~t~  ||  Zn—\  Z0  A))  ||  ) )  ||*ra  Zn—  1 1| 

—  {L  +  K (|| zn  —  zq\\  +  1 1 zn—  i  —  zQ\\  +  ||  A(z0)||))  ||A>0  1|| || F(zn_ 
<  (A  +  K (2 r  +  5o))  fio^n-i 
=  Q5n- 1 
=  Sn, 


\I-B^An\ 


<  II B, 


-ii 


\Bí]  —  Ar, 


'0  1111-^0 

<  fi0(L  +  K (||zn  —  II  +  \\zn  —  Zo\\  +  ||  A(zn)||  +  ||F(^0)||)) 

<  [3q  (A  +  K  (2 r  +  5n  +  5o)) 

=  /30  (A  +  K(2r  +  (1  +  Qn)50)) 

<  A)  (A  +  A  (2r  +  (1  +  Q)S0)) 

=  T, 


\\An  \\^\\[zn,Zn  +  F(znyiF\  ||  < 


fio 


1  -T 


finí 


siempre  que  T  <  1.  Además,  Sn  =  QnSo  <  5q,  puesto  que  Q  <  1  si  se  cumple  (5.28). 


Una  vez  construido  el  par  (5n,fin),  a  partir  de  las  sucesiones  {5n}  y  {fin}i  tenemos  que 
asegurar  la  existencia  de  un  N0  G  N  tal  que  el  par  (Sn0,  /3n0)  satisfaga  las  condiciones  de  con¬ 


vergencia  exigidas  al  método  de  Steffensen  en  el  corolario  |5.3|  Si  observamos  las  condiciones 
(5.12),  (5.13)  y  (5.15)  del  corolario  5.3  y  tenemos  en  cuenta  ón  <  5n_i  y  que  fin  =  Ffif  es 
constante,  para  todo  n  G  N,  por  ser  Q  <  1  y  T  <1,  podemos  asegurar  entonces  las  siguientes 
tres  afirmaciones. 

Primero,  siempre  que 

Lí)  <  Hé’  (5-29) 


donde  fi  =  existirá  Afi  G  N  para  el  que  se  cumpla  la  condición  (5.12)  del  corolario 
es  decir, 

5jví  {^n-í  +  (AAvi  +  A S^Pní  ~  1)  (Mni  +  fiN i))  <  0, 

donde  MNl  =  /^(A  +  KSNl(l  +  fiN J). 

Segundo,  siempre  que 


5.3 


l?<-2, 


(5.30) 


donde  fi  =  ,X°T)  existirá  Af2  GN  para  el  que  se  cumpla  la  condición  (5.13)  del  corolario 
es  decir, 


5.3 


Mn2(  1  —  2A5at2/3tv2)  +  fijsr2(  A  +  A5jv2(1  —  2fiN2)) 

—8KSN2f3N2  K  +  (L/3n2  +  KSN2(3n2  —  1)  (MN2  +  /?v2))  <  1- 
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donde  MN2  =  /3N2(L  +  K5N2(1  +  /3n2))- 

Tercero,  siempre  que  se  cumpla  (|5.30|),  existirá  AL  g  N  para  el  que  se  cumpla  la  condición 


(5.15)  del  corolario  5.3  es  decir, 


1  —  L/3n3  —  (1  +  2K5n3(3n3)MN3  —  RóN3(3N3(l  +  2 f3N3)  +  \[a~n 3  >  0. 
donde  MNs  =  (3N3(L  +  K8Ns(  1  +  /3n3))  Y 

Atv3  =  (Mjv3(1  —  2K5n3/3n3)  +  (3n3(L  +  K5n3(  1  —  2/úv3))  —  l)2 

+8K5n3(3n3  (j^N3  +  (L/3n3  +  K8n3Pn3  —  1)  {Mn3  +  /úv3))  • 


Obsérvese  que  (5.29)  se  cumple  siempre  que  se  cumple  (5.30).  En  consecuencia,  siempre 


que  se  cumpla  (5.30),  podemos  tomar  N0  =  máx{Aú,  jV2,  AI3},  elegir  Xo  =  Zn0  y  aplicar  el 
método  de  Steffensen  a  partir  de  la  aproximación  x0  =  zn0,  dada  por  el  método  simplificado 


de  Steffensen  (5.4),  para  garantizar  la  convergencia  del  método  híbrido  (5.27) 


Para  terminar,  resumimos  todo  lo  anterior  en  el  siguiente  resultado. 

Teorema  5.7.  Sean  X  un  espacio  de  Banach  y  F  :  O  C  X  — y  X  un  operador  no  lineal  defi¬ 
nido  en  un  dominio  abierto  convexo  no  vacío  O.  Supongamos  que  se  cumplen  las  condiciones 
(Hi)-(H3),  (f 5. 28),  (5.30)  y  B(z0,r)  C  O,  donde  r  está  dado  en  (5.25).  Entonces,  existe  un 
N0  G  N  tal  que,  para  x0  =  zn0,  la  sucesión  {xn}  dada  por  el  método  híbrido  (5.21)  está  bien 
definida  y  converge  a  una  solución  de  F(x)  =  0. 


5.4.  Aplicación 

Ilustramos  el  estudio  realizado  anteriormente  con  dos  aplicaciones  a  sistemas  no  lineales, 
siendo  uno  diferenciable  y  otro  no  diferenciable.  Ambos  sistemas  surgen  de  las  discretizaciones 
de  los  problemas  conservativos  definidos  en  la  sección  |1.6.2|  del  capítulo  [T} 


5.4.1.  Sistema  de  ecuaciones  no  lineales  diferenciable 

La  distribución  constante  de  la  temperatura  se  conoce  en  una  varilla  homogénea  de  longi¬ 
tud  1  en  la  que,  como  consecuencia  de  una  reacción  química  o  algún  proceso  de  calor,  el  calor 
se  genera  a  una  velocidad  (¡>{x{t))  por  unidad  de  tiempo  y  por  unidad  de  longitud,  siendo 
f>(x(t))  una  función  dada  por  el  exceso  de  temperatura  x  de  la  varilla  sobre  la  temperatura 
circulante.  Consideramos  el  problema  en  el  que  al  final  de  la  varilla,  í  =  0  y  í  =  1,  se  man¬ 
tienen  esas  temperaturas,  discreteamos  el  correspondiente  problema  de  contorno  dado  por 


( 1.49 )-( 1.50)  y  aproximamos  una  solución  del  sistema  no  lineal  (1.52)  que  surge  del  proceso 


de  discretización. 

Por  ejemplo,  si  elegimos  la  ley  exponencial,  <f{u)  =  exp(w),  para  la  generación  del  calor  y 


m  =  8,  entonces  el  vector  vx  del  correspondiente  sistema  (1.52)  está  dado  por 


=  (vi,v2,...,v&y,  Vt  =  exp(xi),  *—1,2,..., 


(5.31) 


A  continuación,  observamos  que  una  solución  x*  del  correspondiente  sistema  (1.52)  con 


(5.31)  satisface 


5.4.  APLICACIÓN 


137 


donde  ||A_1||  =  10  y  h  —  |,  de  forma  que  ||x*||  e  [0,  Q\]  U  [q2,  H-oo] ,  siendo  Qi  =  0.142342  . . . 
y  Q2  =  3.279579 ...  las  dos  raíces  reales  positivas  de  la  ecuación  escalar  81t  —  10exp(í)  =  0. 
Por  tanto,  podemos  considerar  F  :  ó  C  M8  — y  i8  con 

Íl  =  {x6  M8;  ||x||  <  3}, 


puesto  que  Qi  <  3  <  Q2- 


Además,  la  primera  derivada  de  la  función  F  definida  en  (1.52)  está  dada  por 


F'(x)  =  A  +  fi2diag{nx}. 


En  consecuencia, 


F'(x)  -  F\ y)  =  /?2diag{z}, 


donde  y  =  (yi,  y2,  ■  ■  ■ ,  VsY  Y  z  =  (exp(xi)-exp(yi),  exp(x2)-exp(r/2), . . . ,  exp(o:8)-exp(?/8))t, 

y 

||F'(x)  -  F'(y)||  <  h2  máx  |exp(Ci)|  ||x  -  y||, 

l<i<8 

con  c  =  (ci,  C2,  ■  ■  ■ ,  c$Y  e  O  y  h  —  |,  de  modo  que 


F,(x)-F(y)||  <e3/r2||x-y 


(5.32) 


Considerando  la  diferencia  dividida  (BU) 

(x.  y;  F]  =  /  F’  (rx  +  (1  -  r)y)  cLt 
Jo 


y  teniendo  en  cuenta 

í  ||r(x-u)  +  (l-r)(y-v)||dr  < 
Jo 


2  ( llx  ull  +  ||y  —  v||) , 


y  (5.32),  tenemos 

||[x,y;E]  -  [u,v;F]||  <  í  \\F'  (rx  +  (1  -  r)y)  -  F'  (ru  +  (1  -  r)v)  ||  dr 

Jo 

<  e3h2  í  (r||x  —  u||  +  (1  —  r)||y  —  v||)  dr 
Jo 

=  ^2(||x-u||  +  ||y-v||). 

Luego,  uj(s,t)  =  y/r2(s  +  t)  —  j^(s  +  t). 

Eligiendo  el  punto  de  salida  x0  =  (0,  0, . . . ,  0)*  y  la  norma  del  máximo,  se  obtiene  S  —  ' 


81 


y  ¡3  =  11.177516  . . .,  de  manera  que  la  ecuación  (5.5)  del  teorema  5.2,  que  se  reduce  a 

(2.771684 . .  ,)t2  -  (1.164148  . .  .)t  +  (0.137625  . . .) 

(2. 771684... )t-  (0.774543...)  ~  ’ 

no  tiene  raíces  reales.  Así  que  no  podemos  garantizar  la  convergencia  del  método  de  Steffensen 
a  una  solución  de  (1.52)  con  <p(u)  =  exp(w). 
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Como  <50  =  gj,  /3q  =  11.177516 . . la  ecuación  (|5.19|)  del  teorema 


En  cambio,  si  que  podemos  aplicar  el  método  simplificado  de  Steffensen  (|5.4|)  empezando 
en  zq  =  (0,0, ...  ,0)* 
que  se  reduce  a 


5.5 


(2.771684  . .  .)(£  -  0.283165  . .  .)(t  -  0.209447 . . .) 
(2. 771684... )t-  (0.982890...) 


=  0, 


tiene  dos  raíces  reales  positivas  y  la  más  pequeña,  r  =  0.209447...,  cumple  la  condición 


(5.20),  puesto  que 


Q  =  (30(L  +  K(2r  +  50))  =  0.597631 . . .  <  1, 


y  es  tal  que  B( z0,  r)cíl  =  5(0,3).  Por  tanto,  el  método  simplificado  de  Steffensen  (5.4)  con¬ 
verge  a  una  solución  de  (1.52)  con  <j>(u)  =  exp(w),  la  dada  por  el  vector  x*  =  (x^xíj,  ■  ■  ■ ,  x§ )¿ 


que  aparece  en  la  tabla|5.5[  después  de  ocho  iteraciones  con  una  tolerancia  de  10~16.  Observa- 
mos  que  ||x*||  =  0.138937. . .  <  3  y  x*  es  única  en  la  bola  B(z0,  0.209447 . . .).  En  la  tabla  5.6 
se  muestran  los  errores  |zn  —  x*||  utilizando  el  criterio  de  parada  ||zn  —  zn_1 1|  <  10“16.  Note¬ 


mos  que  el  vector  dado  en  la  tabla  |5.5|  es  una  buena  aproximación  de  la  solución  del  sistema 
(1.52)  con  (¡){u)  =  exp(-u),  puesto  que  ||F(x*)||  <  constante  x  10“16.  Mostramos  la  sucesión 


{||F(zn)||}  en  la  tabla  5.6 


i 

jk 

Xi 

n 

s|c 

xi 

i 

s|c 

xi 

n 

s|c 

xi 

1 

0.05481058 . . . 

3 

0.12475178... 

5 

0.13893761 . . . 

7 

0.09657993... 

2 

0.09657993 . . . 

4 

0.13893761 . . . 

6 

0.12475178... 

8 

0.05481058... 

Tabla  5.5:  Aproximación  de  la  solución  x*  de  (1.52)  con  0(w)  =  exp(w) 


n 

llZn 

-xl 

II  F(z 

n)  || 

0 

1.3893. 

..  x  10"1 

1.2345. . 

x  10~2 

1 

9.4358 . 

. .  x  10"4 

1.1258. . 

x  10"4 

2 

1.3380. 

. .  x  10"5 

1.6342. . 

x  10~6 

3 

1.9003. 

..  x  10“7 

2.3261... 

x  10~8 

4 

2.6986. 

. .  x  10“9 

3.3039... 

x  10“10 

5 

3.8321. 

. .  x  10~n 

4.6918. . . 

x  10”12 

6 

5.4417. 

. .  x  10-13 

6.6625... 

x  10”14 

7 

7.7259. 

. .  x  10’15 

9.4609... 

x  10~16 

Tabla  5.6:  Errores  absolutos  obtenidos  con  el  método  simplificado  de  Steffensen  y  {||F(zn)||} 


Por  otra  parte,  es  fácil  ver  que  se  puede  aplicar  el  método  híbrido  (5.27)  porque  se  cumplen 

ya  que 


las  condiciones  (5.28)  y  (5.30)  del  teorema  5.7 


T  =  (30(L  +  K(2r  +  (1  +  Q)S0))  =  0.926161 . . .  <  1  y  Lf3  =  0  <  - 

respectivamente,  de  manera  que  está  garantizada  la  convergencia  semilocal  del  método  híbrido 
(5.27)  para  un  cierto  N0  G  N.  Así,  la  primera  aproximación  dada  por  el  método  simplificado 
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de  Steffensen  (N0  =  1)  ya  cumple  las  hipótesis  del  teorema  5.2  puesto  que  la  raíz  real  positiva 


más  pequeña  de  la  ecuación  (5.5),  que  ahora  se  reduce  a 


es 


(2.812541  0.354796  . .  .)(*  -  0.001279  . . .) 

(2.812541... )t-  (0.997887...) 

R  =  0.001279  ...  y  cumple  (px6): 

M  +  Pu(R,  R  +  S)  =  0.005711 . . .  <  1. 


=  0, 


Por  tanto,  después  de  una  aproximación  del  método  simplificado  de  Steffensen  (5.4),  po¬ 


demos  aplicar  el  método  de  Steffensen  para  aproximar  la  solución  x*  dada  en  la  tabla  5.5,  que 
se  obtiene  después  de  dos  aproximaciones  más  con  el  método  de  Steffensen  y  una  tolerancia 
de  10”16.  En  la  tabla  5.7  se  muestran  los  errores  ||xn  — x*¡|  y  la  sucesión  {||E(xn)||}  utilizando 
el  mismo  criterio  de  parada  que  antes. 


n 

||xn 

-x*|| 

||F(x 

n)  || 

0 

1.3893. 

. .  x  10”1 

1.2345. . . 

x  10~2 

1 

9.4358 . 

. .  x  10“4 

1.1258. . . 

x  1CT4 

2 

4.4714. 

. .  x  1(T8 

5.5579... 

x  10~9 

Tabla  5.7:  Errores  absolutos  obtenidos  con  el  método  híbrido  (5.27)  y  {||F(xn)||} 


5.4.2.  Sistema  de  ecuaciones  no  lineales  no  diferenciable 


Recordemos  primero  que  si  consideramos  un  sistema  de  ecuaciones  del  tipo  (1.52),  donde 
la  función  (¡){u)  es  no  derivable,  entonces  la  función  F  es  no  diferenciable. 

Consideramos  entonces  0(w)  =  \  +  |w|  +  1,  de  manera  que  el  correspondiente  sistema  de 
ecuaciones  no  lineales  dado  por  (1.52)  con  m  =  8  y 

„2 


vx  =  (vi,v2, . . .  ,vsy , 


X, 


vi  —  tÉ  d"  \xi\  +  1,  í  =  1,  2, . . . ,  8, 

O 


(5.33) 


es  no  diferenciable. 

Como  en  M8  podemos  considerar  diferencias  divididas  de  primer  orden  que  no  necesitan 
que  la  función  sea  diferenciable,  consideramos  la  diferencia  dividida  de  primer  orden  dada 
por  [u,  v;  F]  =  ([u,  v;  F]^)8J-=1  G  £(M8,M8),  donde  [u,  v;  F] %3  está  definido  en  (1.46)  si  m  =  8. 
Luego, 

[u,  v;  F]  =  A  +  h2  cliag{z}, 
donde  zt  =  ^  para  i  =  1,  2, . . . ,  8,  y  h  =  |.  Así, 


[x,  y;  F\  -  [u,  v;  F]  ||  <  máx 


Xj  Ui 


+ 


Vi  ~  Vi 


+ 


Xi 


I  Vi 


Ui 


Xi  -  Vi 


Ui  Vi 


<  h 2  -  máx  |  Xi  —  Ui  +  y  i  —  +  máx 


3  1<*<8 


1<¿<8 


I  Xi  |  \yi\  \Vi\  Vi  | 


•Ei  Vi 


Ui  Vi 
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de  manera  que  ui(s,  t )  =  2 h2  +  y  (s  +  t)  =  |¡-  +  ¿(s  + 1). 

Si  elegimos  el  punto  de  salida  x0  =  •  •  • ,  y  la  norma  del  máximo,  obtenemos 

ó  =  0.086378. . .  y  ¡3  =  11.260889. . .,  de  manera  que  la  ecuación  (5.5)  del  teorema  5.2  que 
se  reduce  a 


(0.092682  . .  .)t2  -  (0.483595  . .  .)t  +  0.709393  . . . 


=  0, 


(0.092682... )t-  (0.390824...) 
no  tiene  raíces  reales.  Por  lo  tanto,  no  podemos  garantizar  la  convergencia  del  método  de 
Steffensen  a  una  solución  de  (1.52)  con  (5.33). 


En  cambio,  si  que  podemos  aplicar  el  método  simplificado  c 


en  z0  = 
reduce  a 


. . . ,  .  Como  So  =  S  y  (3q  =  /3,  la  ecuación 


e  Steffensen  (]5.4|)  empezando 

que  se 


5.19)  del  teorema 


5.5 


(0.092682  7.194574  . .  .)(t  -  1.524492  . . .) 

(0.092682... )t-  (0.717950...) 

tiene  dos  raíces  reales  positivas  y  la  más  pequeña,  r  =  1.524492 . 
(5.20),  puesto  que 

Q  =  p0(L  +  K (2r  +  60))  =  0.423342  . . .  <  1. 


=  0, 

. .,  cumple  la  condición 


Por  tanto,  el  método  simplificado  de  Steffensen  (|5.4|)  converge  a  una  solución  de  (|1.52|)  con 
(5.33),  la  dada  por  el  vector  x*  = 


. ,  xlY  en  la  tabla  5.8,  después  de  cinco  iteraciones 
con  una  tolerancia  de  10~16.  Observamos  que  x*  es  única  en  la  bola  B( z0, 1.524492  . . .).  En  la 
tabla  5.9  mostramos  los  errores  ||zn  — x*||  utilizando  el  criterio  de  parada  ||zn  —  zn„1||  <  10~16. 
Notemos  que  el  vector  dado  en  la  tabla  |5.8|  es  una  buena  aproximación  de  la  solución  del 
sistema  (1.52)  con  ux  definido  en  (5.33),  ya  que  ||F(x*)||  <  constante  x  1CT16.  Mostramos  la 
sucesión  {||F(zn)||}  en  la  tabla  5.9 


i 

n 

x¡ 

i 

x¡ 

n 

X* 

1 

0.05468713 . . . 

3 

0.12442184... 

5 

0.13855711... 

7 

0.09634112. . . 

2 

0.09634112. . . 

4 

0.13855711... 

6 

0.12442184... 

8 

0.05468713... 

Tabla  5.8:  Aproximación  de  la  solución  x*  de  (1.52)  y  (5.33) 


n 

||zn 

-x*|| 

II  F(z 

n)  || 

0 

4.5312. 

. .  x  10“2 

8.6378 . . 

x  10~2 

1 

1.3059. 

. .  x  10~5 

7.6576 . . 

x  10“6 

2 

1.8877. 

. .  x  10"8 

3.4066 . . 

x  10“9 

3 

2.7309. 

.  x  10’11 

4.9253... 

x  10~n 

4 

3.9579 . 

.  x  10~14 

7.1254. . . 

x  10~15 

Tabla  5.9:  Errores  absolutos  obtenidos  con  el  método  simplificado  de  Steffensen  y  {||F(zn)||} 


Por  otra  parte,  es  fácil  ver  que  se  puede  aplicar  el  método  híbrido  (5.27)  porque  se  cumplen 
las  condiciones  (5.28)  y  (5.30)  del  teorema  5.7,  ya  que 


T  =  fio  {L  +  K(2r  +  (1  +  Q)S0))  =  0.425037 . . .  <  1  y 


L0  =  0.483590  . . .  <  - 
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respectivamente,  de  manera  que  está  garantizada  la  convergencia  semilocal  del  método  híbrido 


(5.27)  para  un  cierto  Nq  E  N.  Así,  la  primera  aproximación  dada  por  el  método  simplificado 


de  Steffensen  ( N0  =  1)  ya  cumple  las  hipótesis  del  teorema  5.2  puesto  que  la  raíz  real  positiva 


más  pequeña  de  la  ecuación  (5.5),  que  ahora  se  reduce  a 


(0.069768  . .  .)(t  -  5.570018  . .  ,)(í  -  3.459413  . . .) 
(0.069768... )t-  (0.508965...) 

es  R  =  0.000142  ...  y  cumple  (pn6): 

M  +  Pu(R,  R  +  S)  =  0.556922  . . .  <  1. 


=  0, 


Por  tanto,  después  de  una  aproximación  del  método  simplificado  de  Steffensen  (5.4),  po¬ 
demos  aplicar  el  método  de  Steffensen  para  aproximar  la  solución  x*  dada  en  la  tabla  |5.5 


que  se  obtiene  después  de  dos  aproximaciones  más  con  el  método  de  Steffensen  y  una  tole- 

y  la  sucesión  {||F(xn)||} 


rancia  de  10  16 .  En  la  tabla  5.10  se  muestran  los  errores 


x,-,  -  x" 


utilizando  el  mismo  criterio  de  parada  que  antes. 


n 

||xn 

-x*|| 

||F(x 

n)  || 

0 

4.5312. 

. .  x  10-2 

8.6378 . . . 

x  10~2 

1 

1.3059. 

. .  x  nr5 

7.6576 . . . 

x  10~6 

2 

3.2146. 

.  x  10-12 

4.8940. . . 

x  10-13 

Tabla  5.10:  Errores  absolutos  obtenidos  con  el  método  híbrido  (5.27)  y  {||F(xn)||} 
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